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(57) Abstract 

Up until now, a central and global unit 
have been integrated into one module which 
processes all of the configuration requests. The 
invention provides for a plurality of active units 
which can take over^is task. These units 
are ananged in a h^|^aichy. A request from 
the lowest level is/only transferred to the next 
highest level if tl^ request cannot be processed. 
Ihe highest level is connected to an internal 
or external higher-order configuration memory 
which contains all the configuration data ever 
required for this programme run. The tree 
structure of the coiifiguration units enables a 
kmd of cacheing of the configuration data. The 
configurations are mainly accessed locally. In 
the worst case scenario, a configuration has to 
be loaded frcMn the higher-order configuration 

memory in case the relative data are not available in any of the CTs (configuration tables) in the hierarchy. 
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Anstatt wie bishcr eine zentrale und globale Einheit in cinen Baustein zu integricrcn, welche alle Konfigurations-Anfordenmgen 
beaibeitet. cxisticren nun eine Mehrzahl von hicrarchisch angeordneten aktivcn Einheiten, welche diese Aufgabe abemehmen kdnnen. 
Dabei wird eine Anfoidenmg von der tieftten Ebene nur dann an die nSchst hShcr gelegenc Ebcne weitergelcitet, wwm die 
Anfoidcning nicht bearbeitet wcrden konnte. Die hOchst gclcgcne Ebene ist an cinen intcracn oder extemen tibergeordneten 
Konfigurationsspeicher angcsdUoss«u der alle jemals fOr diesen Piogrammlauf bcnOtigten Konfiguratiwisdaten enthalt die 
Baumstniktur der Konfiguiationscinheiten wild eine Art Cacheing der Konfigurationsdaten crrcichL Zugnffe auf KcmfiguraUonen finden 
hauptsachUch lokal statL Im ungOnstigsten FaH muss eine Konfigurati(m ans dem flbcrgeordnetcn Konfigurationsspeicher geladen wemen, 
falls die betrcffenden Paten in keiner der hierarchisch angeordneten CTs vorfaanden sind. ^ 
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Verfahren zum hierarchischen Cachen von 
Konfigurationsdaten von Datenf lufiprozessoren und 
Bausteinen mi.t zwei- oder mehrdimensionaler 
progranunierbarer Zellstruktur (FPGAs, DPGAs, o. dgl . ) 

Hintergrund der Erfindung 
Stand der Technik 

Der Stand der Technik, welcher diese Patentschrift 
zugrunde liegt, ist durch die Patentanmeldung 196 54 
84 6.2-53 (Verfahren ziaiti selbstandigen dynamischen 
Umladen von Datenf luliprozessoren (DFPs) sowie Bausteinen 
mit zwei- oder mehrdimensionaler programmierbaren 
Zellmatrix (FPGAs, DPGAs, o.dgl.) und der 
Patentanmeldung 196 54 593,5-53 (Umkonf igurierungs 
Verfahren fiir programmierbare Bausteine zur Laufzeit) 
beschrieben. Darin wird ein Verfahren zur Konf iguration 
und Umkonf iguration von DFPs, sowie FPGAs, DPGAs und 
ahnlichen Bausteinen nach dem Stand der Technik, 
beschrieben, bei dem ein separat ausgestalteter zentral 
iibergeordneter Mikrokontroller-ahnlicher Baustein die 
Verteilung von Konfigurationsdaten an mehrere 
untergeordnete, weitgehend passive Steuereinheiten 
iibernimmt . 

Probleme 

Durch den Einsatz einer zentralen und globalen Einheit, 
welche die Rekon figuration von Teilen (z.B. Zellen 
(CELs)) eines oder mehrerer Bausteine steuert, kommt es 
zu Engpassen, wenn viele verschiedene Rekonf igurations- 
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Anfragen auf einmal behandelt werden miissen. Die 
Vorteile der Parallelitat , der beschriebenen Bausteine, 
wird durch eine solche zentrale Einheit stark 
eingeschrankt, da sie den typischen "Flaschenhals" 
darstellt und die Verarbeitung der Daten dadurch 
erheblich verlangsamt. 

Weiterhin ist die Zuordnung der Ereignisquelle zu der zu 
ladenden Konf iguration problematisch, da mit absoluten 
Adressen des. Konf igurationsspeichers gearbeitet wird. 
Die Rekonfigurations-Einheit mufi also eine Art 
Speicherverwaltungssystem beinhalten, welche, ahnlich 
wie in einem Betriebssystem, mitprotokolliert , welche 
Speicherbereich von welcher Konf iguration benutzt 
werden . 

Ein zusatzliches Problem stellt die Verwaltung der 
Resourcen (z.B. CELs) dar. Es muB sichergesteilt sein, 
dali jede CEL nur genau einmal an einen von einer 
Rekonf igurationsanfrage gestartetem Algorithmus vergeben 
wird und zwar denjenigen der auch die restlichen 
umliegenden CEL verwendet, da ansonsten Deadlocks 
auftreten konnen. 

Um die Problematik der Umkonf iguration nochmals zu 
verdeutlichen wird folgendes Beispiel gegeben: 
Eine Matrix aus CELs ist unkonf iguriert und im RESET- 
Zustand. Jede CEL ist in der Lage anzuzeigen, ob sie 
sich in einem umkonf igurierbaren Zustand befindet. Alle 
CELs in der Matrix sind bereit konfiguriert zu werden; 
befinden sich also in einem umkonf igurierbaren Zustand. 
Eine erste Konf igurationsroutine (KRl) wird geladen, 
wobei die Matrix nicht vollstandig benutzt wird. Die 
konfigurierten CELs heben die Anzeige, daJi sie sich in 
einem konf igurierbaren Zustand befinden auf. In eine 
Gruppe der noch nicht konfigurierten CELs wird eine 
zweite, von der Ersten unabhangigen, 
Konf igurationsroutine (KR2) geladen. Eine dritte 
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Konfiguration kann nicht geladen werden, da diese CELs 
der ersten und/oder zweiten Konf igurationsroutine (KR3) 
benotigt, die sich aber in keinem umkonf igurierbaren 
Zustand befinden, da sie benutzt werden. 
KR3 mufi so lange angehalten werden, bis die benotigten 
CEL freigegeben wurden, d.h. KRl und KR2 terminiert 
haben . 

Wahrend der Ausfiihrung von KRl und KR2 kommt eine 
Ladeanforderung fiir eine vierte Konf igurationsroutine 
(KR4) und eine funfte Konf igurationsroutine (KR5) hinzu, 
die alle nicht sofort geladen werden konnen, da sie CELs 
benutzen, die von KRl und KR2 verwendet werden. KR3 und 
KR4 benutzen teilweise die selben CELs, KR5 benutzt 
keine der CELs von KR3 und KR4 . 

Um KR3-5 ordentlich nachzuladen existieren folgende 
Forderungen: 

1- KR3-5 sollen so geladen werden, dafi die zeitliche 
Reihenfolge gemafi den Ladeanf orderungen moglichst 
beibehalten wird. 

2. Moglichst viele KR die unabhangig von einander sind, 
also keine gemeinsamen CELs besitzen, sollen geladen 
werden, um ein Hochstmali an Parallelitat zu erhalten. 

3. Die KRs diirfen sich nicht gegenseitig blockieren, 
d.h. KR3 ist teilweise geladen, kann jedoch nicht weiter 
geladen werden, da andere CELs durch die teilweise 
geladene KR4 blockiert sind; wahrend KR4 auch nicht 
weiter geladen werden kann, da wiederum benotigte CELs 
durch KR3 blockiert sind. Dies fiihrt zu einer typische 
Deadlock-Situation . 

4. Dem Compiler, der die KRs generiert hat ist es nicht 
moglich das zeitliche Zusanunenspiel der KRs zu erkennen 
und so aufzulosen, dafi es zu keiner Konf liktsituation 
kommt . 
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Dabei soil das Verhaltnis zwischen den Aufwand fiir eine 
2U realisierende Schaltung und eines optimalen 
Ergebnisses moglichst gut sein, d.h. Ziel der Erfindung 
ist es mit moglichst geringem Aufwand eine flexible, 
parallele, Deadlock-f reie Konf iguration zu ermoglichen, 
die mit wenig Zeit- und Rechenaufwand durchgefuhrt 
werden kann. Dabei miissen folgende Grundprobleme gelost 
werden : 

- Wiirde nur KR3 geladen werden, ware das Verfahren 
Deadlock-f rei, doch nicht optimal, da auch KR5 geladen 
werden konnte . 

- Wird KR3 geladen, KR4 nicht, jedoch KR5 mufi KR4 so 
vorgemerkt werden, daB es bei einem nachf olgenden 
Ladevorgang die hochste Prioritat besitzt, was einen 
hohen Verwaltungsaufwand bedeutet . 

Die Deadlockf reiheit ist durch das nachfolgend 
beschriebene Verfahren gegeben: 

Verbesserung durch die Erfindung, Aufgabe 

Die Grundaufgabe der vorliegenden Erfindung ist eine 
Einheit - im folgenden Konf igurationstabelle (CT) 
genannt die hierarchisch aufgebaut ist und auf jeder 
Ebene mehrfach vorkommen kann, wobei sich die Zahl der 
CTs von der untersten Hierarchiestuf e zur obersten so 
verringert, dali auf der hochsten Ebene genau eine CT 
vorhanden ist. Jede CT konfiguriert und kontrolliert 
unabhangig von anderen und parallel eine Mehrzahl von 
konf igurierbaren Elementen (CELs) . CTs hoherer 
Hierarchiestuf en konnen Konf igurationsroutinen fiir 
tieferliegende CTs zwischenspeichern . Benotigen mehrere 
der tieferliegenden CTs ein und dieselbe 
Konf igurationsroutine, wird diese bei einer 
hoherliegenden CT zwischengespeichert und von den 
einzelnen CTs abgerufen, wobei die hoherliegende CT die 
betreffende Konf igurationsroutine nur ein Mai aus einem 
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globalen gemeinsamen Konf igurationsspeicher abruft, 
wodurch ein Cache-Effekt erzielt wird. Abseits 
konfigurierbarer Bausteine kann die vorliegende 
Erfindung als Cacheverf ahren fur Instruktions- und 
Datencache in Mikroprozessoren, DFP oder dgl. mit 
mehreren Rechenwerken eingesetzt werden. Dabei konnen, 
je nach Anwendung, einige der im folgenden beschriebenen 
Einheiten entfallen (z.B. FILMO) , am hierarchischen 
Aufbau andert sich jedoch grundlegend nichts. Deshalb 
wird dieser Einsatz als eine Teilmenge betrachtet und 
nicht waiter darauf eingegangen. Ein erheblicher Vorteil 
des beschriebenen Verfahrens gegeniiber gewohnlichen 
Cacheverfahren ist, dafi Daten und/oder Code selektiv, 
d.h. anhand von exakt auf den Algorithmus abgestiiranten 
Methoden gecached werden. 

Ebenfalls ermoglicht die vorliegende Erfindung das 
vollstandig deadlockf reie Umkonf igurieren von groften 
Zellstrukturen . 

Beschreibung der Erfindung 

Anstatt wie bisher eine zentrale und globale Einheit in 
einen Baustein zu integrieren, welche alle 
Konfigurations-Anforderungen bearbeitet, existieren nun 
eine Mehrzahl von hierarchisch (Baumstruktur) 
angeordneten aktiven Einheiten, welche diese Aufgabe 
ubernehmen konnen. 

Dabei wird eine Anforderung von der tiefesten Ebene {den 
Blattern in der Hierarchie) nur dann an die nachst hoher 
gelegene Ebene weitergeleitet, wenn die Anforderung 
nicht bearbeitet werden konnte. Diese Schritte werden 
fiir alle vorhandenen Ebenen wiederholt, bis die hochst 
gelegene Ebene erreicht ist. 

Die hochst gelegene Ebene ist an einen internen oder 
externen ubergeordneten Konf igurationspeicher 
angeschlossen, der alle jemals fur diesen Programlauf, 
benotigten Konf igurationsdaten enthalt . 
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Durch die Baumstruktur der Konf igurationseinheiten wird 
eine Art Cacheing der Konf igurationsdaten erreicht. 
Zugriffe auf Konf igurationen finden hauptsachlich lokal 
statt. Im ungiinstigsten Fall muss eine Konf iguration aus 
den iibergeordneten Konf igurationsspeicher geladen 
werden, falls die betreffenden Daten in keiner der 
hierarchisch angeordneten CTs vorhanden sind. 
Deadlocks werden verhindert, indem eine feste zeitliche 
Abfolge der zu ladenden Konfigurationen eingefiihrt wird 
und die Konfigurationen zu einer Liste zusairanengef aiit 
werden. Die Statusinf ormationen der CEL werden vor dera 
Laden gesichert und bleiben dadurch wahrend des 
Abarbeitens der gesamten Liste von Konfigurationen 
unverandert . 

Die Grundlagen der CT 

Eine Konf igurationstabelle (CT) ist eine aktive Einheit, 
die auf Synchronisationssignale, sogenannten Trigger, 
reagiert. Die Trigger werden von einer zwei- oder 
mehrdimensionalen Matrix aus elektronischen Baugruppen, 
fur gewohnlich arithmentischen oder logischen Einheiten, 
Adressgeneratoren, Recheneinheiten, o,a. - im folgenden 
konfigurierbare Elemente (CEL) genannt - generiert, 
Anhand des auftretenden Trigger wird eine bestimmte 
Aktion innerhalb der CT ausgelost . Dabei ist es Aufgabe 
der CT die Steuerung einer Mehrzahl von CELs zu 
iibernehmen und deren arithmetischen und/oder logischen 
Operationen zu bestimmen. Insbesondere miissen CELs 
konfiguriert und umkonf iguriert werden. Diese Aufgabe 
iibernimmt eine CT, indem sie eine Mehrzahl von moglichen 
Konf igurationsroutinen (KR) , die ihrerseits jeweils aus 
einer Mehrzahl von einzelnen Konf igurationsworten (KW) 
bestehen, verwaltet und eine Mehrzahl von CELs aufgrund 
von Triggerbedingungen mit einer oder mehrerer der KR 
konfigurieren. Dabei erhalt eine CEL jeweils eines oder 
mehrere der Konf igurationsworte, die mit der Adresse der 
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zu konfigurierenden CEL versehen sind. Eine KR mufi dabei 
vollstandig und korrekt auf eine Mehrzahl von CELs 
abgebildet werden, wobei mehrere CELs zu Gruppen 
zusammengefalit sein konnen; die mit jeweils 
unterschiedlichen, aber vollstandig ausgefuhrten KRs 
konfiguriert werden. Dabei sind alle CELs in einer 
Gruppe so verschaltet, daft nach Feststellung einer 
notwendigen Umkonf igurierung alle gruppierten CELs durch 
ein gemeinsames Signal (ReConfig) mitgeteilt wird, dafi 
jede CEL die Datenverarbeitung zu beenden und in einen 
umkonf igurierbaren Zustand iiberzugehen hat. 

Grundlagen der deadlockfreien Umkonf iguration 

Bei zur Laufzeit umkonf igurierbaren Systemen tritt das 
Problem auf, dali das System in einen Zustand gelangen 
kann, in dem jeweils zwei Telle aufeinander warten und 
somit eine Deadlock Situation eingetreten ist. 

Dieses Problem konnte vermieden werden, indem eine neue 
Konf iguration immer nur ganz oder gar nicht in das 
System geladen wird, oder eine Art Timeout-Verf ahren 
eingesetzt wird. 

Dadurch entstehen ein Reihe von Nachteilen (benotigter 
Platz^ Laufzeit etc.) und Problemen, wie zum Beispiel: 

- Vorgehen, falls eine Konf iguration nicht geladen 
werden kann, 

- Verwaltung der Reihenfolge, in der die Konf igurationen 
geladen werden 

- Performance Einbruch, da andere Konf igurationen, 
welche eventuell in die CELs geladen werden konnten, 
nicht beachtet werden. 

Mit dem folgend beschriebenen Verfahren konnen diese 
Probleme beseitigt werden. Es wird von einem DFP System 
nach dem Stand der Technik ausgegangen. 
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Von einer CEL aus, wird ein Trigger-Signal an eine CT 
gesendet. Diese CT stellt die Triggerquelle fest und 
wahlt durch eine Look-Up Tabelle eine zu ladende 
Konf iguration (KR) aus • Die eingehenden Triggersignale 
werden gesperrt, es werden keine weiteren Trigger bis 
zur kompletten Abarbeitung der aktuellen Konf iguration 
akzeptiert. Eine Konf iguration besteht aus mehreren 
Befehlen, weiche an eine Menge von CELs iibertragen wird. 
In einem zur Laufzeit konf igurierbaren System ist 
allerdings nicht sichergestellt, dafi jeder 
Konf igurations-Befehl (KW) auch ausgefiihrt werden kann. 
Dies kann zum Beispiel daran scheitern, daft das 
adressierte konf igurierbare Element (CEL) seine Aufgabe 
noch nicht beendet hat und somit keine neuen 
Konfigurationsdaten entgegen nehmen kann. Urn einen 
Performance Einbruch zu verhindern, werden alle 
Konfigurationsbefehle, weiche nicht abgearbeitet werden 
konnten (da sich die entsprechenden CELs in einem nicht 
umkonfigurierbaren Zustand befanden und die 
Konf iguration ablehnten (REJECT) ) , entsprechend eines 
FIFOs hinter den letzten sich in einem (nachfolgend 
naher beschrieben) speziellen Speicher (FILMO) 
befindenden Konf igurationsbefehl geschrieben. Danach 
wird der nachsten Konf igurationsbefehl, nach dem 
gleichen Verfahren, abgearbeitet. Dies wiederholt sich 
solange, bis das Ende einer Konf iguration erreicht 
wurde . 

Danach geht die CT, wieder in den Zustand iiber, in dem 
sie Trigger-Signale akzeptiert, urn eventuell weiter 
Konfigurationen zu laden. In diesem Zustand arbeitet die 
CT den FILMO. in regelmafiigen Abstanden, durch einen 
Zeitgeber gesteuert, ab. 
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Eine Priorisierung der zu ladenden Konf igurationen wird 
erreicht, indem die CT den Speicher FILMO durchlauft, 
bevor die eigentlich zu ladende Konf iguration bearbeitet 
wird. Durch eine FIFO-ahnliche Struktur des FILMO wird 
sichergestellt, daii KWs, welche wahrend vorhergehenden 
Triggeranforderungen nicht vollstandig abgearbeitet 
werden konnten, automatisch eine hohere Prioritat vor 
den neu abzuarbeitenden WK erhalten. Bei der Abarbeitung 
des Speichers (FILMO) wird jedes durch einen 
Konfigurationsbefehl adressierte konf igurierbare Element 
(CEL) vor Oder wahrende des Sendens eines KWs getestet, 
Ob es sich im Zustand "umkonf igurierbar" befindet. 1st 
dieser Zustand "umkonf igurierbar" (ACCEPT), werden die 
Daten iibertragen und aus dem Speicher FILMO geloscht. 
1st der Zustand "nicht umkonf igurierbar" (REJECT) , 
bleiben die Daten im FILMO und werden beim nachsten 
Durchlauf erneut abgerarbeitet . Die CT verarbeitet den 
nachsten Eintrag im FILMO. 

Dies wiederholt sich solange, bis das Ende des FILMO 
erreicht ist. Danach wird die eigentliche, durch das 
Auftreten des Trigger-Signals aktivierte Konf iguration 
abgearbeitet. Der Aufbau des FILMOs entspricht dabei dem 
FIFO Prinzip, das heifit, es werden die altesten Eintrage 
zuerst verarbeitet. Urn den FILMO auch abzuarbeiten, wenn 
keine neue KR geladen wird, wird der FILMO von einem 
Timer gesteuert in regelmafiigen Abstanden durchlauf en. 

Die librigen, nicht beteiligten konf igurierbaren Elemente 
(CEL) arbeitet wahrend dieser Phase parallel weiter und 
wird nicht in ihrer Funktion beeinfluBt. Dadurch kann 
der Fall eintreten, dali wahrend die CT den FILMO 
abarbeitet, eine oder mehrere konf igurierbaren Elemente 
(CELs) in den Zustand "umkonf igurierbar" ubergehen. Da 
die CT sich mit der Abarbeitung an einer beliebigen 
Stelle innerhalb des FILMOs befinden kann, konnte 
folgender Fall eintreten: 
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Die CT versucht einen ersten Befehl abzuarbeiten dessen 
adressiertes konf igurierende Element (CEL) sich nicht in 
dem Zustand "umkonf igurierbar" befindet. Die CT fahrt 
somit mit dem nachsten Befehl (KW) fort, Zur selben Zeit 
gehen ein oder mehrere konf igurierbaren Elemente in den 
Zustand "umkonf igurierbar" iiber, darunter auch das 
konfigurierbare Element, welches durch den ersten 
Konfigurationsbefehl hatte beschrieben werden konnen. 
Die CT verarbeitet einen zweiten Konfigurationsbefehl 
(KW) , welcher das gleiche konfigurierbare Element (CEL) 
benutzt, wie der erste Konfigurationsbefehl, allerdings 
aus einer anderen Konf iguration stammt. Zu diesem 
Zeitpunkt, befindet sich das konfigurierbare Element 
(CEL) in dem Zustand "umkonf igurierbar" und der Befehl 
kann erfolgreich abgerarbeitet werden, 

Dadurch ist nicht mehr sichergestellt , daii die 
Konfiguration, welche zuerst geladen werden sollte, auch 
tatsachlich zuerst f ertiggestellt wird. Es konnen nun 
zwei teilweise fertige Konf igurationen existieren, 
welche jeweils konfigurierbare Elemente der anderen 
Konf iguration benotigen, um vollstandig geladen zu 
werden. Eine Deadlock-Situation ist eingetreten, die in 
Figur 18 verdeutlicht wird. Konf iguration A und 
Konf iguration B sollen konfiguriert werden. Die CT hat 
den schraffierten Teil von Konf iguration A und 
Konf iguration B bereits geladen, Konf iguration A 
benotigt zur Fertigstellung noch den hell-doppelt 
schraffierten Bereich von Konf iguration B, und 
Konfiguration B benotigt zur Fertigstellung noch den 
dunkel-doppelt schraffierten Bereich von Konfiguration 
A. Da beide Konf igurationen noch nicht vollstandig 
abgeschlossen sind, und somit auch nicht f unktionsf ahig, 
tritt fur keine der beiden Konf igurationen der 
Terminierungszustand ein, in dem eine der 
beiden Konf igurationen entfernt wiirde. Beide 
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Konfigurationen warten darauf, dafi die noch benotigten 
konfigurierbaren Elemente freigegeben werden. 

In dem vorliegenden Verfahren wird ein Deadlock 
verhindert/ indem die CT vor der Abarbeitung des FILMOs 
die Zustande aller konf igurierbarer Elemente erfaJit und 
danach bis zur Beendigung des Vorgangs keine Anderungen 
mehr zulafit, bzw. auftretende Anderungen ignoriert. Mit 
anderen Worten, es werden entweder die Zustande aller 
konfigurierbaren Elemente vor der Abarbeitung des FILMOs 
gesichert oder eine Veranderung der Zustande wahrend der 
Abarbeitung des FILMOs verhindert. Eine mogliche 
teehnische Ausfiihrung ist der Einsatz eines Registers in 
jedem konfigurierbaren Element, in das der Zustand vor 
Abarbeitung des FILMOs gesichert wird. Die CT arbeitet 
nur auf Basis der erfafiten Zustanden und nicht mit den 
aktuellen Zustanden der konfigurierbaren Elemente. 
Dadurch ist sichergestellt , daB jeder zu bearbeitende 
Befehl (KW) den gleichen Zustand der konfigurierbaren 
Elemente (CELs) vorfindet. Dieser Schritt schlieBt nicht 
aus, dafi ein oder mehrere konfigurierbaren Elemente 
wahrend der Abarbeitung des FILMOs, in den Zustand 
"umkonfigurierbar" ubergehen. Diese Anderung ist fur die 
CT wahrend der Verarbeitung lediglich nicht sofort 
sichtbar, sondern erst zu Beginn des nachsten 
Durchlaufs. 

Konfigurations-Reihenfolgen 

Zur Konfiguration bestimmter Algorithmen ist es 
unbedingt notwendig, die Reihenfolge in der die KW in 
die CEL geschrieben werden exakt einzuhalten. 
Beispielsweise ist es sinnvoll vor Anschluli einer CEL an 
ein Bussystem, zuerst das Bussystem zu konf igurieren, 
damit die CEL nicht. an einen von einer anderen Routine 
benutzten Bus angeschlossen wird. Mit anderen Worten, 
eine CEL wird nur konf iguriert, wenn vorher die 
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entsprechenden Busverbindungen konfiguriert werden 
konnten. 

In dem erf indungsgemaBen Verfahren wird die Einhaltung 
eines fasten Ablaufes wie folgt erreicht: 
Konf igurationsworte (KWs), deren Ausfiihrung entscheidend 
fur die Konf iguration der nachf olgenden KWs sind, werden 
besonders gekennzeichnet (und im f olgenden KWR genannt) . 
Schlagt die Konf iguration eines solchen KWR fehl, werden 
alle nachfolgenden KWs innerhalb der betreffenden 
Konf igurationsroutine (KR) auf den FILMO geschrieben und 
in diesem Durchlauf nicht ausgefiihrt. Auch beim 
Durchlaufen des FILMOs werden samtliche KWs, die sich in 
der Reihenfolge hinter einem KWR befinden, dessen 
Konf iguration fehlschlug, in dem aktuellen Durchlauf 
nicht ausgefiihrt. 

Cache-Verfahren 

Die CT-Struktur ist hierarchisch aufgebaut, d.h. es 
existieren in einem Baustein mehrere CT-Ebenen. Die 
Anordnung entspricht vorzugsweise einer Baumstruktur 
(CT-Tree) , Dabei ist der Wurzel-CT (Root-CT) ein 
externer Konf igurationsspeicher (ECR) , der samtliche KRs 
enthalt zugeordnet, wahrend den Blattern die 
konf igurierbaren Elemente (CELs) zugeordnet sind/ die 
einzelne KRs aufrufen. Den CTs der mittleren Ebenen sind 
jeweils die konf igurierbaren Elemente zugeordnet, die 
sich auf derselben Hierarchiestufe befinden. 
Jeder CT ist ein lokaler interner Speicher zugeordnet. 
Dieser Speicher wird partiell geloscht, wenn neu zu 
speichernde KRs keinen Platz mehr haben, Oder dies 
explizit durch einen speziellen CT-Befehl (REMOVE) 
angefordert wird. Dabei erfolgt das Loschen KR-weise, 
anhand einer Loschstrategie, so dafi bestenfalls nur die 
KR geloscht werden, die nicht mehr angefordert werden 
Oder explizit beim REMOVE-Befehl angegeben sind. 
Ebenfalls werden die KR einzeln geldscht, nur genau so 
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viele, dafi genau so viel Speicher frei ist, wie 
notwendig ist urn die neu zu ladende KR in den Speicher 
zu schreiben. Dadurch wird erreieht, daB moglichst viele 
KR zur Optimierung des Cache-Ef f ektes in dem Speicher 
verbleiben. 

Der Vorteil liegt darin, dali jede, einer beliebigen CXx 
untergordente CT, die sich also weiter oberhalb im CT- 
Baum befindet eine KR, die in der CTx gespeichert ist, 
nicht von dem externen Konf igurationsspeicher ECR 
anfordert, sondern direkt von CTx erhalt. Dadurch ergibt 
sich eine Cachestruktur iiber mehrere Ebenen. Der 
Dateniibertragungsaufwand im CT-Baum und insbesondere die 
benotigte Speicherbandbreite des ECR wird erheblich 
gesenkt . 

Mit anderen Worten speichert jede CT die KRs der unter 
ihr liegenden CT zwischen. D.h. die tief erliegenden CTs 
erhalten die benotigten KRs direkt von den 
daruberliegenden, ein Speicher zugr if f auf das externe 
ECR ist nicht notwendig. Nur wenn eine benotigte KR 
nicht in einer der hoherliegenden CTs bereits vorhanden 
ist, muii die KR iiber einen Zugriff auf das ECR geladen 
werden. Dadurch ergibt sich einer besonders effiziente 
hierarchische Cache-Struktur fur KRs, 
Auf Basis dieser Struktur ergeben sich auch mogliche 
Loschstrategien, die allerdings je nach Anwendung 
empirisch festgelegt werden sollten. Einige 
Moglichkeiten sind: 

- Loschen des altesten Eintrage 

- Loschen der kleinsten Eintrage 

- Loschen der groliten Eintrage 

- Loschen der am seltensten abgerufenen Eintrage 
Griindlage von CT-Hierarchien 

Um einen Cache-Effekt zu erzielen, werden CTs zu einer 
Hierarchie in Baumstruktur zusammengeschaltet . Zwischen 
den einzelnen Knoten (CTs) befindet sich ein Bussystem 
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(Inter-CT-Bus) , dal5 jeweils einen oberen Knoten (CTs) 
mit mehreren unteren Knoten (CTs) verbindet . Dabei 
fordern untere Knoten (CTs) Daten von den oberen Knoten 
(CTs) an, die oberen Knoten senden die Daten daraufhin 
an die unteren Knoten. Die unteren Knoten tauschen 
untereinander Statusinf ormationen aus, dazu werden die 
Netzwerke zwischen den hoheren Knoten verwendet, die 
entsprechend die Adressen auflosen miissen. 

CT-Hierarchie und Adressierung 

CT-Hierarchien sind so angeordnet, daS> zur Adressierung 
der einzelnen CTs ein Binarbaum verwendet werden kann. 
Das bedeutet, daB das niederwertigste Adressbit die 
einzelnen Blatter des Baumes kennzeichnet und jedes 
weitere Adressbit jeweils eine Hierarchieebene hoher 
selektiert. Jede CT besitzt damit eine eindeutige 
Adresse . 

Die nachfolgende Tabelle zeigt, wie die einzelnen 
Adressbit s den jeweiligen Ebenen zugeordnet sind: 
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Soil einer Gruppe von CTs eine iibergeordnete CT 
zugeordnet werden, werden mehrere Adressbits der Gruppe 
entsprechend zusammengef afit . 
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Die nachfolgende Tabelle zeigt, wie die einzelnen 
Adressbits den jeweiligen Ebenen zugeordnet sind, dabei 
befindet sich auf Ebene 0 eine Gruppe mit 8 CTs 
(Adresbit 2» .0) : 
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Der Aufbau des Binarbaumes kann eindimensional oder 
mehrdimensional erfolgen, indem pro Dimension ein 
Binarbaum aufgebaut wird, 

Eine bestimmte CT (TARGET) wird adressiert, indem die 
initierende CT (INITIATOR) entweder die exakte 
Zieladresse angibt, oder TARGET relativ adressiert. 

Die Auswertung einer relativen Adresse wird im folgenden 
nahers beschrieben: 



Beispiel eines relativen Adressfeldes fiir eine 
zweidimensionale Adressierung: 
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BitlS ist gesetzt, wenn die CT der nachsthoheren 
Hierarchiestufe selektiert werden soil. 

Bitl4 kennzeichnet Broadcasts, selektiert also alle CTs. 
Die X/Y-Adressen geben die Adresse von TARGET ausgehend 
von der Adresse von INITIATOR an. 

Die Adressen sind vorzeichenbehaftete "signed" Integer- 
Zahlen. Durch Addition der Y/X-Addressen des 
Adressf eldes. zu der aktuellen Adressposition, wird 
TARGET bestimmt* Jede Ebene besitzt eine bestimmte 
Adressbreite (Addresswidth) . Die Addierer entsprechen 
dieser Breite. 

Ein Uber- oder Unterlauf bei der Addition bedeutet, daft 
die adressierte CT nicht unterhalb des aktuellen Knotens 
liegt und die Adressanforderung wird an die 
dariiberliegende CT (den nachsthoheren Knoten) 
weitergegeben . 

Tritt kein Uber- oder Unterlauf auf, befindet sich 
TARGET unterhalb des aktuellen Knotens. Das auf der 
aktuellen Ebene berechnete Adressbit (vgl. Tabellen) 
selektiert den direkt unter dem aktuellen Knoten 
liegende CT. Von dieser aus wird jeweils anhand des 
entsprechend berechneten Adressbits die nachst tiefere 
CT (Knoten) selektiert. 

Priorisieriing von Zugriffen in CT-Hierarchien 

Die Zugriffe auf den Inter-CT-Bus werden von einem 
Arbiter verwaltet. Dabei sind alle unteren Knoten gleich 
priorisiert. Der obere Knoten besitzt eine hohere 
Prioritat. Dadurch sind Zugriffe, die von einem hoheren 
Knoten nach unten iibertragen werden, oder bereits einen 
weiten Weg vom INITIATOR aus zuriickgelegt haben anderen 
Zugriffen uberlegen. 

Der Grundaufbau einer CT 

Die nachfolgende Ubersicht iiber die CT gibt einen 
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iiberbliclc uber die einzelnen Baugruppen. Die detailierte 
Beschreibung der Baugruppen wird im folgenden gegeben. 

Kern einer CT ist die Steuer-Statemachine (CIS) die 
samtliche Abarbeitungen von Konf igurationsroutinen (KRs) 
steuert. Der CTS zugeordnet ist, der Garbage-Kollektor 
{GO, der das Entfernen von KR aus dem Speicher (CTR) 
der CT steuert; das FILMO, das die Verwaltung der noch 
abzuarbeitenden KWs iibernimmt und die LOAD-Statemachine, 
die das Laden von KRs steuert. 

Der Speicher (CTR) ist als gewohnlicher Schreib-Lese- 
Speicher ausgestaltet , wobei alle technisch moglichen 
Implementierungen zum Einsatz kommen konnen, und wird 
zur lokalen Speicherung von KRs fiir die jeweilige CT und 
deren untergeordnete CTs verwendet. Als Sonderfall kann 
der Speicher (CTR) auch als ROM, EPROM, EEPROM, Flash- 
ROM o.a. ausgestaltet sein, urn den Baustein mit einer 
festen, ASIC oder PLD-ahnlichen (siehe Stand der 
Technik) Funktion zu versehen. 

Zur Generierung der CTR-Adressen werden vier als ladbare 
Zahler ausgestaltete Pointer verwendet: 

1. Free-Pointer (FP) . Zeigt auf den ersten freien 
Speicherplatz hinter der letzte KR im CTR. 

2. Garbage-Pointer (GP) . Zeigt auf einen durch den 
Garbage-Kollektor (GC) zu entfernenden Eintrag aus dem 
CTR. 

3. Move-Pointer (MP). Zeigt auf eine Speicher stelle im 
CTR, von der ein giiltiges, nicht zu entfernendes 

Konf igurationswort (KW) , also einen Eintrag eines KR, an 
den durch GP definierten Eintrag kopiert/bewegt wird. 

4. Program-Pointer (PP) . Zeigt auf das momentan von der 
CTS ausgefiihrten KW. 
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KW werden iiber ein Ausgabe-Interf ace (OUT) an die 
zugehorenden CELs weitergegeben . Die CELs quittieren 
(ACCEPT) f sof ern sie sich in einem umkonf igurierbaren 
Zustand befinden den Empfang der KW. Wird ein KW nicht 
quittiert (REJECT) , wird es in einem FIFO-ahnlichen 
Speicher (FILMO) , zeitweise zwischengespeichert, uin zu 
einem spateren Zeitpunkt, ohne den Program-Pointer zu 
benutzen, erneut an die adressierte CEL geschrieben zu 
werden. . . 

Eine Aufforderung zur Abarbeitung eines KR erhalt die 
CTS durch Triggersignale . Die Triggersignale durchlaufen 
eine Maske, das ist ein Filter, der unerwunschte Trigger 
ausfiltert (ausmaskiert ) . Eine Maske kann nach dem Stand 
der Technik durch UND-Gatter (AND) aufgebaut werden, die 
einen Trigger mit einem Freigabe-Signal UND-verkniipft . 
Die Trigger werden liber einen priorisierten Round-Robin- 
Arbiter (SCRR-ARB) in Binarsignale umgewandelt . Ein 
priorisierter Round-Robin-Arbiter verkniipft den Vorteil 
der Gleichberechtigung eines Round-Robin-Arbiters mit 
der Erkennung der nachsten Freigabe in einem Takt, also 
dem Vorteil eines Prioritats-Arbiter , 

Die maskierten Trigger werden als Adresse auf eine erste 
Lookup-Tabelle (LUTl) geschaltet, das ist ein Speicher, 
der dem als Adresse eingehenden Trigger das ID der 
betreffenden KR zuordnet und auf den Datenleitungen 
ausgibt . 

In einer zweiten Lookup-Tabelle (LUT2) wird die ID der 
KR der Adresse des Speicherplatzes der KR im CTR 
zugeordnet. Die zweite Lookup-Tabelle wird nicht nur zur 
Zuordnung von Trigger-Signalen verwendet, vielmehr 
benutzen Befehle, die eine ID als Parameter verwenden, 
die LUT2 ebenfalls zur Adresszuordnung. 
Die Zuordnung der Trigger-Signale zu den betreffenden 
IDs wird liber den nachfolgend beschriebenen Befehl 
"REFERENCE" in die LUTl eingetragen. Die Verwaltung der 
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LUT2, also die Zuordnung der IDs zu den Adressen im CTR, 
geschieht automatisch durch die CIS und den GC. 

Zum besseren Verstandnis der CT ist im folgenden ein 
moglicher Grundbef ehlssatz dargestellt: 

1. BEGIN <ID> 

Durch BEGIN <ID> wird der Anfang einer 
Konfigurationsroutine gekennzeichnet . <ID> gibt die 
eindeutige Identif ikationsnummer der 
konfigurationsroutine an, 

2. STOP 

Durch STOP wird das Ende einer Konfigurationsroutine 
gekennzeichnet . An dieser Stelle beendet die 
Konfigurationstabelle (CT) die Abarbeitung der 
Konfigurationsroutine. Der Garbage-Kollektor (GC) 
beendet das Entfernen von Eintragen dieser 
Konfigurationsroutine. 

3. EXECUTE <ID> 

Springt zum Beginn (BEGIN <ID>) einer 
Konfigurationsroutine. Ist diese Routine nicht im 
Speicher der CT vorhanden, so wird sie von der 
dariiberliegenden CT angefordert, bzw. aus dem Speicher 
geladen. 

4 . LOAD <ID> 

Fordert die KR <ID> von der dariiberliegenden CT an. 

5. REMOVE <ID> 

Ruft den GC auf , urn die Konfigurationsroutine <ID> von 
BEGIN <ID> bis STOP aus dem Speicher der CT zu entfernen 
und die nachfolgenden Konf igurationsroutinen so weit 
vorzuschieben, dafi kein Speicherloch durch die entfernte 
Konfigurationsroutine entsteht. 

6. PUSH <FORCED> <ADDRESS> <DATA> <EXIT> 

Schreibt die Konf igurationsdaten <DATA> an das Register 
<ADDRESS>. Ist <FORCED> gesetzt, werden die Daten auch 
geschrieben, wenn das RECONFIG-Flag des betreffenden 
Zielregisters nicht gesetzt ist. <EXIT> wird verwendet 
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und anzuzeigen, dafi es sich urn ein KWR handelt, das bei 
einem REJECT die weitere Ausfuhrung der nachf olgenden 
KWRs abbricht. 

7. MASK <SR> <TRIGGER> 

Setzt die Trigger-Maske mit <TRIGGER>, bzw. setzt sie 
mit <TRIGGER> zuruck, abhangig von <SR> (Set/Reset) . 

8. WAIT <UNMASKED> <TRIGGER> 

Halt die Abarbeitung der Konf igurationsroutine an und 
wartet auf den Trigger <TRIGGER>. 1st <UNMASKED> 
gesetzt, wird auf das erwartete Trigger unabhangig des 
Zustandes der Trigger-Maske reagiert . 

9. TRIGGER <TRIGGER><CT#> 

Sendet den Binarwert eines Triggers an. die ubergeordnete 
durch CT# adressierte CT. 

10. GETBUS/GETCTS 

Baut eine Verbindung zu dem Inter-CT-Bus auf. 

11. LOOSEBUS/LOOSECTS 

Lost die Verbindung zum Inter-CT-Bus auf. 

12. REFERENCE <TRIGGER><ID> 

Schreibt in die LUTl bei Adresse <TRIGGER> den Wert 
<ID>, wodurch einem Triggersignal eine bestimmte KR 
zugeordnet wird. 

Die Befehle EXECUTE, LOAD, REMOVE, PUSH, MASK, WAIT, 
TRIGGER, REFERENCE sind nur innerhalb der Klammer BEGIN 
... STOP giiltig. Aulierhalb dieser Klammer werden die 
Befehle nicht ausgefiihrt. 



Der Aufbau einer Konf igurationsroutine (KR) sieht 
folgt aus: 
BEGIN <ID>; 

giiltige Befehle 
STOP; 
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Indirekte Addressierung (Referenzierung) 

Das Cache-Prinzip der CT ermoglicht das 

Zwischenspeichern einer KR in einer CT, wobei die KR von 
mehreren unterschiedlichen tief erliegenden CTs oder CELs 
genutzt werden. 

Warden von den tieferliegenden Einheiten Zugriffe auf 
das externe Interface des Bausteines (z.B. RAM, 
Peripherie) durchgef uhrt, ergibt sich die Notwendigkeit 
unterschiedliche Adressen oder Teile des externen 
Interfaces zu speichern. Dadurch vrtirde sich der Inhalt 
der einzelnen benotigten KRs grundlegend unterscheiden. 
Ein Caching ist nicht mehr moglich. 
Abhilfe schafft eine indirekte Referenzierung. Dazu 
werden spezielle KR (im folgenden IKR genannt) 
verwendet, die die notwendigen externen Parameter 
beinhalten und setzen. Eventuell werden uber Trigger 
andere unterschiedliche KRs in verschiedenen 
Hierarchieebenen aufgerufen. Ab Ende einer IKR wird das 
eigentliche KR aufrufen. Lediglich die IKR sind nicht 
cachebar, wahrend die aufgerufenen KR durchaus 
einheitlich und daher cachebar sind. Es ist sinnvoll, 
die GroBe der IKR auf das absolute Minimum zu 
reduzieren, namlich ausschlieJilich die externen und 
unterschiedlichen Parameter und den Aufruf der 
einheitlichen KR. 

Eine indirekte Konfigurationsroutine (IKR) ist wie folgt 
auf gebaut : 
BEGIN <ID>; 

xxx; giiltige Befehle, wobei lediglich externe Peripherie 

angesteuert werden sollte, 
TRIGGER <ID>; Start-, Stop- oder Lade-Anf orderungen an 

Periphere Prozesse 

• • • 

GOTO <ID>; Sprung zur einheitlichen KR 
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STOP; 



Sonderfalle: 

1. WAIT_FOR_BOOT 

Dieses Kommando ist nur an der ersten Adresse des CTR 
gultig. Wahrend des Boot-Vorganges wird zuachst die 
komplette Boot-KR in das CTR geschrieben, jedoch nicht 
die Beginnsequenz des Boot-KR BEGIN <0> . An dessen 
Stelle (auf Adresse 1) steht WAIT-FOR-BOOT, das bei 
einem RESET automatisch gesetzt wird. Erst nachdem die 
gesamte Boot-KR in das CTR geschrieben ist, wird 
WAIT_FOR_BOOT mit BEGIN <0> iiberschrieben und die CTS 
beginnt mit der Abarbeitung der Boot-KR. 
WAIT_FOR_BOOT darf nicht innerhalb eines Programmes 
auftreten. 

2. BOOT <CT-ID> 

BOOT <CT-ID> kennzeichnet in welche CT die nachfolgende 
Boot-KR geschrieben werden soil. Nach BOOT <CT-ID> folgt 
kein BEGIN, die Boot-KR wird nciht durch STOP, sondern 
durch ein nachf olgendes BOOT <CT-ID> abgeschlossen. Ein 
STOP beendet den Bootvorgang. 

BOOT <CT-ID> darf nicht innerhalb eines Programmes 
auftreten. 

Boot— Vorgang 

Nach einem RESET ladt die CT des obersten Hierarchie- 
Levels (ROOT-CT) die Boot-KR in die CTs der unteren 
Hierarchien. Dazu existiert ein Sprung an eine 
festgelegte Adresse (BOOT-ADR) im, der ROOT-CT 
zugeordneten, externen Konf igurationsspeicher (ECR) . Die 
ROOT-CT fiihrt diesen Sprung durch und erreicht die Boot- 
Sequenz. Diese ist wie folgt aufgebaut: 
BOOT <CT-IDO>; COMMAND; COMMAND; . . . 
BOOT <CT-ID1>; COMMAND; COMMAND; 
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BOOT <CT-IDn>; COMMAND; COMMAND; ... 
STOP; 

Wahrend des Boot-Vorganges wird zunachst die komplette 
Boot-KR in das CTR ab Adresse 2 der durch <CT-ID> 
angegebenen CT geschrieben. Die Beginnsequenz des Boot- 
KR (BEGIN <0>) wird nicht auf Adresse 1 geschrieben. An 
dessen Stelle steht WAIT-FOR-BOOT, das bei einem RESET 
automat isch gesetzt wird. Erst nachdem die gesamte Boot- 
KR in das CTR. geschrieben ist, und die ROOT-CT das 
nachste BOOT <CT-ID> erreicht hat, wird STOP an das Ende 
des Boot-KR in das CTR geschrieben und WAIT_FOR_BOOT mit 
BEGIN <0> iiberschrieben. Die CTS beginnt mit der 
Abarbeitung der Boot-KR. 

Laden einer Konfigur at ions routine 

Es existierem drei Gundmechanismen urn eine 
Konfigurationsroutine, aufier der Boot-KR anzufordern: 

1. Ausfiihren eines LOAD <ID> durch die CTS 

2. Ausfiihren eines EXECUTE <ID> durch die CTS, wobei die 
KR mit der betreffenden ID nicht im CTR vorhanden ist. 

3. Auftreten eines Triggers, der iiber die LUTl auf einen 
<ID> iibersetzt wird, dessen zugehorige KR nicht im CTR 
vorhanden ist. 

Der Ablauf in alien drei Fallen ist derselbe: 
Die ID der angeforderten KR wird der LUT2 als Adresse 
angegeben. Die LUT2 uberpriift, ob eine giiltige Adresse 
im CTR existiert. Existiert diese nicht, d.h. <ID> zeigt 
in der LUT2 auf den Wert 0, wird load <ID> an die CTS 
gesendet . 

Die CTS fordert daraufhin die <ID> betreffende KR bei 
der hierarchisch iibergeordneten CT an. Diese Anforderung 
erreicht die ubergeordnete CT in Form eines Triggers und 
wird entsprechend von ihr ausgewertet. 
Die ubergeordnete CT sendet die angeforderte KR an die 
anfordernde CT. Die Daten werden ab der Adresse, auf die 
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der FREE-POINTER (FP) zeigt in das CTR geschrieben, 
wobei der FP nach jedem Schreibzugrif f urn eins erhoht 
wird. 

Erreicht der FP die obere Grenze des CTR, wird der 
Garbage-Kollektor (GC) aufgerufen, um die unterste KR 
innerhalb des CTR zu entfernen und das CTR zu 
komprimieren. Der FP wird dabei neu gesetzt. Dieser 
Vorgang findet so lange statt, bis die zu ladende KR 
komplett in das CTR pafit. 

Spmingtabelle im Konf igurationsspeicher 

Der der ROOT-CT zugeordnete Konf igurationsspeicher 
beinhaltet samtliche KR, die fiir eine Applikation 
geladen werden mussen. Im externen 

Konfigurationsspeichers (ECR) befindet sich an einer 
festgelegten Adresse (ADR-BOOT) Sprung zu der Boot- 
Konfigurations-Routine. In einem weiteren festgelegten 
Speicherbereich (LUT-ECR) beliebiger, jedoch innerhalb 
einer Applikation fest vorgegebener Lange die Spriinge zu 
den einzelnen KRs . Dabei wird die <ID> der jeweiligen KR 
als Adresse im ECR verwendet, an der die Startadresse 
der jeweiligen KR steht; wodurch KRs indirekt adressiert 
werden: 

ID -> LUT-ECR -> KR 

Anderung der KR im Konfigurationsspeicher 

Die KR mit der ID <A> soil geandert werden. Zunachst 
schreibt der HOST die neue KR fiir die ID <A> an eine 
freie Speicherstelle im ECR. Die ID <A> wird zusammen 
mit der neuen Adresse der KR im Konfigurationsspeicher 
von der ubergeordneten Einheit (HOST) in ein dafiir 
vorgesehenes Register der ROOT-CT geschrieben. Die ROOT- 
CT sendet an alle darunterliegenden CTs das Kommando 
REMOVE <A>. Daraufhin entfernen alle CTs beim Erreichen 
eines STOP Oder wahrend IDLE-Zyklen, also sobald keine 
KR ausgefuhrt wird, die auf diese ID bezogene KR aus dem 
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CTR und setzen die LUT2 an Adresse <A> auf "NoAdr", das 
bedeutet, es existiert keine giiltiger Adresseintrag fiir 
ID <A> in LUT2. Wird die ID <A> erneut angefordert, 
zwingt der fehlende Eintrag ("NoAdr") an Stelle <A> in 
die LUT2 jede CT die KR <A> vom ECR neu anzufordern. 

Das FILMO 

Ein KR besteht hauptsachlich aus dem Befehl PUSH, der 
neue Konf igurationsworte an eine bestimmte Adresse 
schreibt. 1st das Schreiben eines Konf igurationswortes 
des Types KW nicht moglich, da das adressierte 
konfigurierbare Element (CEL) nicht bereit ist eine neue 
Konfiguration zu empfangen (REJECT), wird das 
Konfigurationswort statt an das adressierte 
konfigurierbare Element (CEL) in einen Speicher, im 
folgenden FILMO genannt, geschrieben. Die nachf olgenden 
Befehle werden normal abgearbeitet, bis erneut ein 
Konfigurationswort nicht geschrieben werden kann, das 
dann in das FILMO geschrieben wird. 

Ist das Schreiben eines Konf igurationswortes des Types 
KWR nicht moglich, da das adressierte konfigurierbare 
Element (CEL) nicht bereit ist eine neue Konfiguration 
zu empfangen (REJECT) , wird das Konfigurationswort statt 
an das adressierte konfigurierbare Element (CEL) in 
einen Speicher, im folgenden FILMO genannt, geschrieben. 
Alle nachfolgenden Befehle bis zum Ende der KR werden 
nicht an die CEL, sondern direkt in das FILMO 
geschrieben. 

Das FILMO wird in IDLE-Zyklen und vor jedem Ausfiihren 
eines neuen KR komplett durchlaufen. Dabei wird, 
beginnend beim altesten Datenwort, entsprechend eines 
FIFOs nach dem Stand der Technik, jedes ausgelesene Wort- 
des FILMOs an sein adressiertes Element zu senden; dabei 
muB das adressierte Element bereit sein das 
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Konfigurationswort zu empfangen. Sofern die Datenworter 
von Beginn an geschrieben werden konnen (d.h. die 
adressierten konf igurierbaren Elemente (CELs) sind 
bereit) wird der Eintrag aus dem FILMO nach Art eines 
FIFOs entfernt. Kann ein Konfigurationswort nicht 
geschrieben werden, wird es ubersprungen und nicht aus 
dem FILMO entfernt, Im Gegensatz zu einem FIFO werden 
die Daten nach dem ubersprungenen Konfigurationswort 
weiter ausgelesen. Konf igurationsworte, die nach einem 
ubersprungenen Konfigurationswort geschrieben werden 
konnen werden entweder je nach Implementierung des 
FILMOs 

1. als geschrieben markiert und nicht aus dem FILMO 
geloscht, wobei als geschrieben markierte 
Konfigurationsworter bei den folgenden Durchlaufen nicht 
mehr gelesen werden, bzw. sofort geloscht werden, sofern 
kein ubersprungenes Konfigurationswort mehr vor ihnen 
liegt; 

Oder 

2. aus dem FILMO geloscht, wobei die 
Konfigurationsworter vor und nach dem geloschten 
Konfigurationswort erhalten bleiben, dabei mussen zum 
Loschen die nachf olgenden Worte nach vorne (oben) oder 
die davorliegenden Worte nach hinten (unten) geschoben 
werden, wobei die Reihenfolge der Konf igurationsworte 
unbedingt beibehalten wird. 

Wird eine neue KR ausgefiihrt, werden die 
Konf igurationsworte (KW) , die von der CTS nicht an die 
adressierten Elemente (CELs) geschrieben werden konnten, 
erneut an das FILMO angehangt, d.h. die KW werden an das 
Ende (aus Leserichtung) des FILMOs geschrieben. 1st das 
FILMO voll, d.h. es existieren keine freien Eintrage fur 
Konf igurationsworte, wird die Ausfiihrung des KR 
gestoppt. Das FILMO wird so lange durchlaufen, bis 
geniigend Konf igurationsworte geschrieben werden konnten 
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und entsprechend viele freie Eintrage entstanden sind, 
woraufhin das KR weiter abgearbeitet wird. 
Das FILMO stellt einen FIFO-ahnlichen Speicher dar, der 
immer vom altesten Eintrag an linear durchlaufen wird, 
im Gegensatz zu einem FIFO werden jedoch Eintrage 
iibersprungen (First In Linear Multiple Out) . 

Die Funktion der Konf igurationstabellen- 
Stateznachine (CTS) 

Die Konfigurationstabellen-Statemachine (CTS) iibernimmt 
die Steuerung der CT. Dabei fiahrt sie die Befehle der KR 
aus und reagiert auf eingehende Trigger. Sie ubernimmt 
die Verwaltung des FILMOs, i.b. liest sie in IDLE-Zyklen 
und vor dem Ausfuhren einer KR das FILMO aus. 
Sie reagiert auf die von der LUT-Struktur generierten 
Signalen illegal <TRG> (Illegal Trigger, siehe Fig. 1, 
0102) und load <ID>. load <ID> wird generiert, wenn ein 
Cache-Miss in LUT2 vorliegt (0105), oder die durch ID 
referenzierte KR/IKR als geloscht markiert wurde (0107) . 
Sie reagiert auf die Steuersignale der iibergeordneten 
CT. 

Ein Impleinentationsbeispiel fiir die Verarbeitung der 
Befehle ist in den Figuren 2 bis 7 dargestellt. 

Steuersignale an libergeordnete CTs 

- illegal <TRG> (0102) 

Zeigt der iibergeordneten CT an, dali ein unbekannter 
Trigger <TRG> aufgetreten ist. 

- load <ID> (0105/0107) 

Fordert die iibergeordneten CT zum Laden der <ID> 

auf. 

- trigger <TRG> <CT#> (0108) 

Sendet einen Trigger <TRG> an die libergeordnete 

Oder 

an die adressierte CT <CT#>. 
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Steuersignale von iibergeordneten CTs 

- remove <ID> (siehe Fig. 15, 1513) 

Fordert die CT zura loschen der <ID> auf . 

- write_to„FP <data> (siehe Fig. 2, 0205) 

Sendet Daten an die CT. Die Daten werden an das 
Ende des belegten Speichers angehangt . 

Die Fxmktion des Garbage-Kollektors (GC) 

Der CTR unterliegt zwei Problemen: 

1. Verweist ein LOAD- oder EXECUTE-Befehls, bzw. ein 
Trigger, auf eine ID, deren KR nicht im CTR vorhanden 
ist, mufi die KR nachgeladen werden. U.U. ist jedoch 
nicht genugend Platz im CTR vorhanden urn die 
angeforderte KR zu laden. 

2. Beim Auftreten eines REMOVE <ID> ist die 
entsprechende KR aus dem CTR zu entfernen. Dabei 
entsteht, sofern sich die KR nicht am Ende des CTR 
befindet eine Liicke. Beim Laden einer neuen KR wird die 
Liicke u.U. nicht wieder ganz aufgefiillt oder die Lucke 
ist zu klein fiir die neue KR. Dies fuhrt zu einer 
Fragment ierung des CTR. Die Aufgabe des Garbage- 
Kollektor ist es, KR aus dem CTR zu entfernen, um Platz 
fur neue Eintrage zu schaffen UND nach Entfernen der 
Eintrage den CTR so umzuorganisieren, daS> alle 
verbleibenden KR als geschlossener Block hintereinander 
im Speicher liegen und die f reigewordenen Speicherblocke 
als ein geschlossener Block an einem Ende des CTR 
liegen. 

Dadurch konnen auf optimale Weise und ohne Verluste an 
Speicherplatz neue KR nachgeladen werden. 

Auswerten von Triggeriinpulsen 

Jede CT besitzt einen AnschluJi an mehrere zu ihrer 
jeweiligen Hierarchieebene gehorenden Triggersignale, 
die zu einem Bus zusammengef aJ5t sind. Eingehende Trigger 



28 



wo 99/44147 



PCT/DE99/00504 



werden iiber eine Maske ausgewertet, d.h. nur die 
f reigeschalteten Triggersignale werden weitergeleitet . 
Die freigeschalteten Triggersignale werden taktsynchron 
in einem Sample-Register zwischengespeichert 
(gesampled) , Ein Arbiter wahlt eines der gespeicherten 
Triggersignale aus und wandelt das Signal in einen 
binaren Vektor. Das gewahlte Triggersigrial wird aus den 
Sample-Register geloscht. Der Binarvektor wird an eine 
erste Lookup-Tabelle (LUTl) weitergeleitet, die den 
Binarvektor in die Identif ikationsnummer (ID) der 
auf zurufenden Konf igurationsroutine (ICR) iibersetzt. 
Die ID wird in einer zweiten Lookup-Tabelle (LUT2) in 
die Adresse der KR im CT-Speicher (CTR) iibersetzt. Die 
CT-Statemachine (CTS) setzt ihren Programm-Pointer (PP) 
auf diese Adresse und beginnt rait der Ausfuhrung der KR. 
Voraussetzung ist, dafi jeder iiber die Maske 
f reigeschaltete Trigger einen entsprechenden Eintrag in 
LUTl besitzt. Fehlt dieser, wird ein Fehlerzustand an 
die CTS weitergeleitet (illegal trigger), dabei wird 
jede ID = "NoAdr" als nicht vorhandener Eintrag 
gewertet, "NoAdr" ist ein implementationsabhangig 
gewahltes Token. 

Fehlt der Eintrag in LUT2, d.h. die auf die ID bezogene 
KR befindet sich nicht im CTR, wird eine Ladeanf orderung 
an die CTS gesendet (load <ID>) . 

Senden von Triggeriiapulsen an die iibergeordnete 
CT 

Neben der bereits beschriebenen Schnittstelle zu einer 
iabergeordneten CT zum Laden von KR existiert eine 
weitere Schnittstelle zum Austauschen von frei 
definierbaren Befehlen, insbesondere jedoch 
Triggervektoren. Dabei sendet eine CT 

- entweder an alle anderen CTs einen Befehl (BROADCAST) 
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- Oder an eine beliebige adressierte CT einen Befehl 
(ADDRESSED) 

Der Befehl "Triggervektor" stellt einen Binarwert dar, 
der auf einen Eintrag in der LUT2 der empfangenden CT 
ref erenziert . 

Das Senden von Triggervektoren ist notwendig urn 
beispielsweise innerhalb einer IKR eine KR in einer 
weiteren CT zu starten um beispielsweise die Peripherie 
Oder den Speicher anzusteuern. 

Zur Weiterleitung von Triggervektoren an eine 
iibergeordnete CT existieren 2 Mechanisraen: 

1. Der LUTl wird ein Bit hinzugefiigt, das angibt, ob der 
Inhalt des Speichers als KR ID oder als Binarwert fiir 
einen Triggerimpuls betrachtet wird. Liegt ein 
Triggerimpuls vor, wird der Dateninhalt von LUTl direkt 
als Trigger an die iibergeordnete CT gesendet. 

2. Mit dem Befehl TRIGGER kann der Binarwert eines 
Triggers angegeben werden, der direkt an die 
iibergeordnete CT gesendet wird. (Alternativ konnten 
statt einem Triggerwert auch direkt IDs iibertragen 
werden) . 

Zum Starten einer KR in einer fremden CT iiber 
Triggervektoren muJS zum Erreichen der Deadlockf reiheit 
ein Synchronisationsverf ahren geschaffen werden. Das 
Verfahren rauJi beachten, daS lediglich eine KR innerhalb 
eines bestinunten Gruppe von CTs weitere KR auf anderen 
CTs innerhalb dieser Gruppe startet. Das Starten mehrere 
KR gleichzeitig kann zu einem Deadlock zwischen den CTs 
fiihren, ahnlich des bereits beschriebenen Deadlocks auf 
der CEL-Ebene. 

Das Grundprinzip eines solchen Verfahrens lauft wie 
folgt ab: 
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Ein KR ist wie folgt aufgebaut: 

GETCTS/GETBUS 
TRIGGER <ID>, <CT#> 
TRIGGER <ID>, <CT#> 

LOOSECTS/LOOSEBUS 



Der Befehl "GETCTS" innerhalb einer KR einer CT 
(INITIATOR) zeigt an, daft im foigenden Signale an andere 
CTs (TARGET) gesendet werden. Mit Trigger <ID>, <CT#> 
wird die ID einer zu startenden KR an die CT mit der 
eindeutigen ID CT# gesendet. Das Senden des Triggers 
geschieht dabei zunachst an die direkt libergeordnete CT, 
die entsprechend der CT# den Trigger an eine wiederum 
untergeordnete CT innerhalb ihres CT-Raumes sendet oder 
an die ihrerseits iibergeordnete CT (siehe CT- 
Hierarchien) . Erreicht der Befehl die TARGET quittiert 
diese den Empfang. 

Beim Durchlauf des Befehls durch eine CT wird eine 
Prioritatskennung des Befehls jeweils um eines erhoht. 
Trifft die Weiterleitungsanf orderung eines Befehls auf 
eine weitere Anforderung innerhalb einer CT, wird der 
Befehl mit der niedersten Prioritat zuruckgewiesen. 
Dadurch wird 

a) sichergestellt, dafi innerhalb eines uberschneidenden 
Systemes nur ein Befehl zu einer Zeit ausgebreitet wird 
und dadurch auch nur eine KR gestartet wird, was zu der 
geforderten Deadlockf reiheit fiihrt, 

b) sichergestellt, dafi der bislang am wenigsten weit 
ausgebreitete Befehl zuruckgewiesen wird, was zu einer 
Steigerung der Performance fiihren kann 

Nach Zuriickweisen eines Befehls, werden alle 
vorhergehenden Befehle innerhalb der GETCTS/LOOSECTS 
ebenfalls zuruckgewiesen, d.h. INITIATOR sendet an alle 
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TARGET das Signal DISMISS und die Ausfiihrung der KR 
startet nach einer Wartezeit bei GETCTS erneut. 
Die Quittierungen aller Trigger innerhalb eines 
Befehlsabschnittes GETCTS . , . LOOSECTS warden an die 
INITIATOR-CT gesendet. Bei jeder eintref f enden 
Quittierung wird die Verarbeitung des nachsten Befehls 
f ortgesetzt . 

Bei Erreichen des Befehls LOOSECTS sendet INITIATOR an 
alle TARGET das Signal GO. Dadurch starten die TARGET- 
CTs die Ausfiihrung der KR mit der von Trigger 
iibertragenen ID. 

TARGETS wechseln nach Auftreten eines Triggers in einen 
Zustand, in welchem sie auf das Auftreten eines GO oder 
DISMISS Signales warten. 

Aufgrund der besseren Implement ierbarkeit wird weiterhin 
ein leicht modif iziertes Verfahren vorgestellt: 
Zwischen den CTs einer Gruppe einer Hierarchieebene 
befindet sich ein Bussystem (Inter-CT-Bus) . Dieses 
Bussystem verbindet alle CTs der Gruppe und eine direkt 
der Gruppe iibergeordnete CT. 

Durch den Befehl GETBUS, der funktionell GETCTS ahnlich 
ist, wird das Bussystem von einer CT arbitriert. Die 
Befehle werden uber das Bussystem an die CTs derselben 
Gruppe weitergeleitet . Befindet sich die adressierte CT# 
nicht innerhalb der Gruppe, wird durch die iibergeordnete 
CT automatisch deren iibergeordneter Bus arbitriert und 
der Befehl weitergeleitet. Die arbitrierten Busse 
bleiben INITIATOR zugeordnet und somit fiir alle anderen 
CTs gesperrt/ bis entweder eine Zuriickweisung erfolgt, 
Oder der Befehl LOOSEBUS den Bus auf lost. LOOSEBUS ist 
mit LOOSECTS vergleichbar . Vor Ausfiihren des Befehls 
LOOSEBUS wird das GO-Signales an alle beteiligten Cts 
gesendet. Dies erfolgt entweder durch den Befehl 
LOOSEBUS Oder einen speziellen vorgeschalteten Befehl . 
Befehle, i.b. Trigger werden ebenfalls gemafi des bereits 
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beschriebenen Grundverfahrens verarbeitet. Eine 
Zuriickweisung erfolgt, wenn ein Bussystem nicht 
arbitriert warden kann. Beim Arbitrieren sind die CTs 
einer Ebene jeweils gleich priorisiert, die 
iibergeordnete CT besitzt eine hohere Prioritat. 
Beim Senden eines Befehls iiber den Inter-CT-Bus bleibt 
der Befehl so lange aktiv, bis die adressierte CT den 
Befehl akzeptiert (ACCEPT) Oder zuruckweist (REJECT) . 

Der priorisierte Round-Robin-Arbiter 

Der priorisierte Round-Robin-Arbiter (Single-Cycle- 
Round-Robin-Arbiter SCRR-ARB) ist taktsynchron 
aufgebaut, d.h. bei jeder - je nach Implement ierung 
positiven oder negativen - Taktflanke (TFl) liefert er 
ein Ergebnis. Die eingehenden Signale (ARB- IN) 
durchlauf en eine Maske (ARB-MASK) , die von dem Arbiter 
gemaB dem nachfolgend beschriebenen Verfahren selbst 
verwaltet wird. Die Ausgangssignale der Maske werden an 
einen Prioritatsarbiter (ARB-PRIO) nach dem Stand der 
Technik geleitet. Der Arbiter liefert taktsynchron bei 
jeder Taktflanke (TFl) ein Ergebnis (ARB-OUT) , d.h. den 
Binarwert des hochstpriorisierten Signals nach der Maske 
(ARB-MASK) . Dem Ergebnis zugeordnet ist ein Signal 
(VALID) , das angibt, ob der Binarwert giiltig oder 
ungialtig ist. Abhangig von der Implement ierung der 
Prioritatsarbiters ist es moglich, dafi beim Anliegen des 
Signals 0 und beim Anliegen keines Signals derselbe 
Binarwert generiert wird: In diesem Fall zeigt VALID an, 
dafi das Ergebnis ungiiltig ist, sofern kein Signal 
anliegt. Dieses Signal wird 

1. als Ergebnis der Arbiters ausgegeben 
und 

2. auf einen Dekoder geschaltet, der die Binarwert e - 
wie in der folgenden Tabelle beispielsweise fiir einen 3- - 
bit Binarwert angeben - auskodiert . (Das 
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Kodierungsverfahren ist gemali dieses Prinzips auf jeden 
beliebigen Binarwert anpafibar) : 



Binarwert 


Auskodierung 


Bemerkung 


(ARB-OUT) 


(ARB-DEC) 




111 


0111 1111 




110 


0011 1111 




101 


0001 1111 




100 


0000 1111 




oil 


0000 0111 




010 


0000 0011 




001 


0000 0001 




000 


1111 1111 


Reset-Zustand und 

wenn Binarwert (ARB-OUT) ungiiltig 



Dem Dekoder zugeordnet ist ein Register (ARB-REG) , das 
die auskodierten Werte (ARB-DEC) des Dekoders bei der zu 
TFl inversen Taktflanke (TF2) ubernimmt. ARB-DEC wird 
auf die Maske (ARB-MASK) zuriickgekoppelt und schaltet 
die einzelnen Eingangssignale (ARB- IN) frei. 

Der funktionale Ablauf im Arbiter ist wie folgt: 

1. Nach einem RESET sind alle ARB-IN liber ARB-MASK 
freigeschaltet, da ARB-DEC alle Signale auf 
"Freigabe" stellt . 

2. Das hochst priorisierte gesetzte ARB-IN 

(beispielsweise besitzt in der obigen Tabelle das 
Signal 7 (binar 111) die hochste Prioritat und 0 

(binar 000) die niederste Prioritat) wird als 
Binarwert ausgegeben. 

3. Uber ARB-DEC wird das Signal gesperrt, sowie alle 
weiteren Eingange die evtl. noch h5her priorisiert 
waren, aber nicht gesetzt sind. 

4. Die folgenden Schritte 5 und 6 wiederholen sich so 
lange, bis das Signal 0 (binar 000) erreicht ist, 
Oder kein Signal hinter ARB-MASK mehr anliegt. Dann 
schaltet ARB-DEC (siehe Auskodierungstabelle) wieder 
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alle Signale durch ARB-MASK iiber ARB-DEC frei und der 
Ablauf beginnt bei Schritt 2. 

5. Das nunmehr hochst priorisierte gesetzte ARB-IN wird 
als Binarwert ausgegeben. 

6. tiber ARB-DEC wird das Signal gesperrt, sowie alle 
weiteren Eingange die evtl- noch hoher priorisiert 
waren, aber nicht gesetzt sind. (Welter mit Schritt 
4) 

Dadurch wird erreicht, daii alle Eingangssignale 
gleichberechtigt behandelt werden und bei jedem 
Taktzyklus eines der Eingangssignale (ARB-IN) binar 
auskodiert und ausgegeben (ARB-OUT) wird. 
ARB-REG kann mit einem Enable-Eingang (EN) versehen 
werden, der eine Anderung des Registerinhaltes nur bei 
TF2 zulaJit, wenn ein entsprechendes Signal anliegt . 
Dadurch wird nicht bei jedem Takt ein Binarvektor 
ausgegeben, sondern abhangig von einer Freischaltung 
durch EN und TF2 . Der Eingang wird zur Synchronisation 
notwendig, wenn die nachgeordnete Schaltung die 
Verarbeitung nicht in einem Taktzyklus durchfiihren kann, 
sondern mehrere Zyklen benotigt und erst dann den 
nachsten Binarvektor akzeptiert, 

Unter Umstanden ist es sinnvoll eine Reihe von Signalen 
durch den Arbiter als hoher priorisiert anzusehen, 
wahrend die Mehrzahl der Signale gleichpriorisiert ist. 
Dies ist z.B. bei dem vorhergehend beschriebenen 
Verfahren zur Weiterleitung von Signalen zwischen CTs 
notwendig. Urn ein Signal hoher zu priorisieren, wird der 
hochstpriorisierte Anschluli des ARB-PRIO nicht maskiert, 
d.h. an der Maske (ARB-MASK) vorbeigeleitet . Dadurch 
wird das Signal bevorzugt behandelt. 

Aufbau einer CT auf Basis eines Mikrokontrollers 

Abweichend von den bisherigen Beschreibungen kann eine 
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CT auch in einer Mikrokontrollerarchitektur 
implementiert werden. 

Es ist leicht einsehbar, daft die Grundfunktionen, wie 
Triggersteuerung, Lookup-Tabelle LUTl und LUT2, sowie 
die Inter-CT-Kommunikation und das Schreiben der BCW an 
die CEL ohne weiteres auch von einem Mikrokontroller 
ausgefuhrt werden konnen. Lediglich der Aufbau eines 
effizienten FILMOs stellt ein Problem dar, das sich vor 
allem in der erreichbaren Performance bemerkbar macht. 
Daher wird auf den Aufbau des FILMOs gesondert 
eingegangen. 

Aufbau des FILMOs 

Der FILMO ist nicht als separater Speicher ausgestaltet . 
Vielmehr ist der gewohnliche Progranimspeicher um die 
FILMO-Funktionalitat erweitert. Dazu wird ein 
zusatzliches Bit (FILMO-BIT) jedem KW zugeordnet, das 
anzeigt, ob das entsprechende KW in die CEL geschrieben 
wurde oder nicht. Ist FILMO-BIT gesetzt, wird das 
entsprechende KW nicht ausgefuhrt. Beim Schreiben eines 
Kws in den Speicher wird das FILMO-BIT zuriickgesetzt . 
Alle KRs innerhalb einer CT werden iiber eine Verkettete- 
Liste (FILMO-LIST) in der Reihenfolge miteinander 
verbunden, wie sie durch Trigger oder LOAD<ID> 
aufgerufen wurden. Eine KR bleibt so lange in der FILMO- 
LIST, bis sie komplett ausgefuhrt wurde, dann wird sie 
aus der Liste entfernt. Die FILMO-LIST wird entsprechend 
des FILMO-Verfahrens durchlaufen und stellt damit einen 
direkten Ersatz fiir den FILMO-Speicher dar. 
(Der Vollstandigkeit halber sei angemerkt, daJi entgegen 
des ursprunglichen FILMO-Verf ahrens keine KR zweimal in 
der Liste vorkommen kann. Wird eine KR aufgerufen, die 
noch in der FILMO-LIST steht, mufi deren Ausfiihrung so 
lange verzogert werden, bis sie aus der FILMO-LIST 
entfernt wurde.) 



36 



wo 99/44147 



PCT/DE99/00504 



Per Aufbau einer FILMO-Speicherstelle ist wie folgt: 



FILMO-BIT KW 



Befehle 

Der Mikrokontroller unterstutzt die folgenden Befehle, 
die direkten Einflufi auf das FILMO haben: 
PUSH Schreiben eines KW an eine CEL 

PUSHSF Schteiben eines KW an eine CEL und setzen des 
FILMO-BITs, wenn das KW angenoininen 

(ACCEPT) wurde 

PUSHRET Schreiben eines KW an eine CEL und Rucksprung 
(RETURN) aus der Unterroutine, wenn das KW 
nicht von der CEL angenommen wurde (REJECT) . 
Dieser Befehl wird verwendet, wenn 
nachfolgende KW in der KR von der 
Konfiguration dieses KWs (ACCEPT) abhangig 
sind; durch den Rucksprung aus dem KR wird 
deren Konfiguration so lange verhindert, bis 
PUSHRET erfolgreich (ACCEPT) ist. 
Schreiben eines KW an eine CEL, nur dann, wenn 
zuvor innerhalb der KR kein REJECT auftrat. 
Dient ahnlich wie PUSHRET dazu, Abhangigkeiten 
in der Konf igurationsreihenf olge von KWs zu 
handhaben . 



PUSHNR 



Garbage Kollektor 

Entsprechend der bisherigen Beschreibung wird ein 
Garbage-Kollektor (GC) zum Entfernen von nicht mehr 
benotigten KRs benutzt. Der GC lauft an, wenn entweder 
der Platz zum Laden einer neuen KR im Speicher nicht 
mehr ausreicht und IDs entfernt werden mussen; oder eine 
KR exp.lizit durch den Befehl REMOVE - mit der Angabe der 
ID der zu loschenden KR - geloscht wird. 
Urn den GC-Lauf moglichst einfach zu gestalten, werden 
samtliche KRs liber eine verkettete Liste miteinander 
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verbunden. GC lauft die Liste durch und entfernt die 
nicht mehr benotigten KR, indem sie von anderen KR 
iiberschrieben und die Listeneintrage entsprechend 
angepaBt werden. Dabei warden die alle verbleibenden KR 
im Speicher so verschoben, daB die durch die zu 
loschenden KR entstehende Speicherlucke geschlossen wird 
und am Ende des Speichers ein grolSerer zusammenhangender 
Freiraum entsteht. 

Aufbau einer KR 

Ein moglicher Grundaufbau einer KR ist in der folgenden 
Tabelle dargestellt: 

jmp START; 

length 

garbage - pr evious 

garbage - next 

FILMO " previo us 

FILMO - NEXT 

CACHE - statistic 

KR - statistic 

START : 



ret; 



Zu Beginn der KR erfolgt ein Sprung iiber den folgenden 
Header hinweg zum Start der Befehlssequenzen. Es folgt 
die doppelt verkettete Liste fiir den Garbage-Kollektor, 
in der samtliche KR miteinander verbunden sind. 
"length" gibt die Lange der KR an. Diese Information 
kann fiir Block-Move-Befehle nach dem Stand der Technik 
verwendet werden, die Anwendung finden, wenn die KR im 
Speicher bewegt werden miissen (Garbage, Load, etc.). 
In der anschliefienden doppelt verketteten Liste ist der 
FILMO aufgebaut, wobei nur die KRs miteinander verbunden 
sind, die KWs enthalten, die noch nicht an die CEL 
geschrieben wurden. 
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Es folgt eine Statistik iiber das Cache-Verhalten, die 
beispielsweise die Anzahl der Aufrufe der KR (pro Aufruf 
wird der Wert urn 1 erhoht), das Alter (anhand der Anzahl 
der GC-Laufe iiber die KR mefibar : pro GC-Lauf wird der 
Wert um 1 erhoht), etc. enthalt. Diese Statistik kann 
der GC auswerten, wenn aus Speicherplatzgrunden eine KR 
entfernt werden mufi. Fiir das Cachen ergeben sich durch 
solche Statistiken erhebliche Vorteile. So kann 
beispielsweise abhangig vom verwendeten Cache- 
Algorithmus, entsprechend den Anforderungen der 
Applikation, der Mikrokontroller so programmiert werden, 
daft 

1. die alteste/neueste KR 

2. die kleinste/groftte KR (s. Eintrag "length") 

3. die am seltensten/am haufigsten aufgerufene KR 
aus dem Cache geloscht wird, wenn freier Speicher 
benotigt wird. Dabei konnen selbstverstandliche weitere 
sinnvolle Statusinf ormationen gespeichert werden. Ein 
derart selektives Cachen ist bei heute bekannten Cache- 
Strukturen nicht moglich. Insbesondere werden frei 
programmierbare Cachealgorithmen in Caches nach dem 
Stand der Technik nicht unterstiitzt. 

Abschliefiend ist eine KR-Statistik vorhanden, die 
beispielsweise die Anzahl der noch nicht konf igurierten 
(REJECT) Oder der konf igurierten (ACCEPT) KWs enthalt. 
Gleichzeitig kann die Adresse des ersten noch zu 
konf igurierten KW gespeichert werden. Dies hat den 
Vorteil, daB bei einem FILMO-Durchlauf direkt auf das KW. 
gesprungen werden kann und nicht das komplette KR 
durchlaufen werden muB, was zu einer erheblichen 
Performancesteigerung fiihrt. 

Abschlieliend sei zu den KR angemerkt, daB die 
verketteten Liste vorzugsweise durch Eintrag der 
Vorganger/Nachfolger-ID aufgebaut werden, da damit die 
absoluten Speicheradressen ohne Probleme vom GC 
verschoben werden konnen. Innerhalb einer KR sollten nur 
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relative Spriange anstatt absoluter Sprunge verwendet 
werden, um Probleme beim Laden der KR und bei GC-Laufen 
zu veinneiden, da sich die absolute Adressen dabei 
verandern. 

Der Vollstandigkeit halber soil noch erwahnt werden, dafi 
gemaB dem bereits beschriebenen Prinzip auch beim 
Einsatz eines Mikrokontrollers vor dem Ausfiihren einer 
neuen KR (aufgrund eines Triggers oder Befehls, auch von 
einer anderen CT aus) der FILMO durchlaufen wird und vor 
Durchlauf des FILMOs der Zustand der CEL 
(umkonf igurierbar oder nicht) gesichert wird. 

Figuren 

Die nachfolgend beschriebenen Figuren verdeutlichen 
anhand eines Implementationsbeispiels die Verwaltung von 
Konfigurationsdaten nach dem vorgestellten Verfahren; 

Figur 1: Verfahren der Adressgenerierung innerhalb der 
Lookup-Tabellen 

Figur 2-7 Abarbeitung der Befehle und Funktion der 
Statemachinen 

Figur 8: Aufbau des SCRR-ARB 
Figur 9: Aufbau der LUTl & LUT2 

Figur 10: Aufbau der Pointerarithmetik und des CTR 

Figur 11: Aufbau eines FILMO 

Figur 12a: Hierarchische Anordnung der CTs 

Figur 12b: Senden eines Triggers zwischen den CTs 

Figur 12c, d: Methoden zum Senden eines 

Figur 13: Aufruf einer KR durch mehrere IKR 

Figur 14: Aufbau der LUTl einer ROOT-CT 

Figur 15: Aufbau der HOST-Steuerung einer ROOT-CT 

Figur 16: Verdeutlichung des LUT und ECR Konzeptes 

Figur 17: Ablauf steuerung einer CT mittlerer 

Hierarchieebene, bzw. einer ROOT-CT 
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Figur 18: Deadlockproblematik bei der Konf iguration 
eines 2-dirnensionalen Arrays (siehe Patentbeschreibung) 
Figur 19: Verdeutlichung des FILMO-Konzeptes 
Figur 20: Grundprinzip der Inter-CT-Kommunikation 
Figur 21: Implemetierungsbeispiel der Inter-CT- 
Kommunikation nach dem GETCTS-Verf ahren 
Figur 22: Implemetierungsbeispiel der Inter-CT- 
Kommunikation nach dem GETBUS-Verf ahren 
Figur 23: Busstruktur des Inter-CT-Bus 
Figur 24: Adressierung innerhalb von CT-Hierarchien 
Figur 25: GARBAGE-Liste 
Figur 26: FILMO-Liste 

Figur 27: FILMO Funktion innerhalb einer KR 

Figur 28: Speichern der Zustande vor Ausfiihren einer KR 

Oder des FILMOs . 

Beschreibung der Figuren 

Figrur 1 zeigt den Ablauf der CTR-Adressgenerierung 
innerhalb einer CT. Dabei wird ein eingehender binarer 
Triggervektor (0101) in der LUTl auf eine gultige KR 
Oder IKR ID tibersetzt. Existiert keine gultige ID, wird 
ein Signal "Illegal Trigger" generiert (0102), das 
anzeigt, daJi der Trigger nicht in LUTl bekannt ist. Das 
Signal kann als Fehlermeldung an die iibergeordnete CT 
weitergeleitet oder ignoriert werden. Die Ubersetzung 
von "Trigger" nach "ID" wird mittels des Befehls 
"REFERENCE" in die LUTl eingetragen. 

Eine gultige ID (0103) wird an die LUT2 weitergeleitet. 
IDs die innerhalb von Befehlen, also durch einen 
Operanden, angegeben sind (0104), treffen direkt auf die 
LUT2. Die LUT2 tibersetzt eine eingehende ID in die 
Adresse der KR/IKR innerhalb des CTR. Ist die KR/IKR 
nicht im CTR gespeichert (es liegt im Cache nicht vor) , 
wird das Signal "Miss" generiert (0105) , Ist die 
iibersetzte Adresse der KR/IKR mit dem Token "NoAdr" 
markiert, wird mit "NoEntry" (0107) angezeigt, da^ die 
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Adresse geloscht ist. "Miss" und "NoEntry" zeigen an, 
daB eine Ubersetzung auf eine CTR-interne Adresse nicht 
moglich ist. Auf Grundlage dieses Signals ladt die LOAD- 
Statemachine die KR/IKR mit der entsprechenden ID von 
einer daruberliegenden CT nach. 

Sofern eine gultige Adresse vorhanden ist, wird diese an 
die Pointerarithmetik des Adressgenerators 
weitergeleitet (0106) . In LUTl wird ein eingehender 
binarer Trigg.ervektor entweder in eine ID oder einen 
weiteren Triggervektor ubersetzt, wobei in diesem Fall 
der Triggervektor ausgegeben wird (0108) . 

In Figur 2 ist der Ablauf beim Laden einer KR/IKR 
dargestellt. Zunachst wird die ID (0201) der zu ladenden 
KR/IKR an die dariiberliegende CT gesendet. Daraufhin 
wird in die LUT2 an der Stelle des Eintrages fur die 
angeforderte ID der Wert des FreePointers (FP) 
eingetragen. FP zeigt auf den Eintrag hinter dem letzten 
fiir eine KR/IKR genutzen Eintrag im CTR. Dies ist der 
erste Eintrag, auf den die zu ladende KR/IKR gespeichert 
wird. 

Die Statemachine wartet auf ein Datenwort von der 
druberliegenden CT. Sobald das Wort verfiigbar ist, wird 
es an die durch FP ref erenzierte Stelle geschrieben, FP 
wird inkrementiert. Zeigt FP auf einen Eintrag hinter 
dem Ende des CTR wird der erste Eintrag im CTR entfernt 
urn Platz zu schaffen (0202); dabei wird FP aktualisiert . 
Ist das von der daruberliegenen CT gesendete Datenwort 
"STOP", wird der Ladevorgang abgebrochen (0203), 
ansonsten mit dem Warten auf ein neues Datenwort 
fortgesetzt (0204) . 

In Figur 3a ist der "MASK"-Bef ehl dargestellt. Der 
Operand des Befehls wird in das MASK-Register 
geschrieben. Das MASK-Register befindet sich am Eingang 
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der Triggersignale vor LUTl und maskiert ungultige 
Trigger aus. 

In Figur 3b wird durch den Befehl "TRIGGER" der Operand 
des Befehls als Triggervektor zu den anderen CTs 
abgesendet . 

In Figur 3c wird durch den Befehl "REFERENCE" die 
Ubersetzung eines Triggers zu der entsprechenden KR/IKR 
ID in die LUTl geschrieben. 

In Figur 4a wir der Befehl "WAIT" dargestellt. Der 
Operand des Befehls wird in das WAITMASK-Register 
geschrieben. Alle Trigger, bis auf den/die Erwarteten 
und daher in WAITMASK f reigeschalteten werden ignoriert . 
Erst nach Auftreten des Triggers wird zum Programmf lufi 
zuruckgekehrt . 

In Figur 4b ist der "PUSH"-Bef ehl abgebildet. Das 
Konf igurationswort wird zum adressierten 
konf igurierbaren Element (CEL) gesendet. Akzeptiert das 
CEL das Konfigurationswort nicht; da das CEL sich 
beispielsweise im Zustand "nicht konf igurierbar " 
befindet; wird das Konfigurationswort in den FILMO 
geschrieben (0401) . 

Figur 5 zeigt den Ablauf eines "REMOVE" -Befehles . Es 
gibt zwei Auf rufvarianten : 

1. Die erste im CTR liegende KR/IKR wird aus dem CTR 
entfernt. Dem GarbagePointer (GP) wird die Adresse 0 des 
CTR zugewiesen (0501) . 

2. Eine spezifisch durch ihre ID angegebene KR/IKR wird 
aus dem CTR entfernt. Dem GarbagePointer (GP) wird die 
erste Adresse des zu entfernenden KR/IKR im CTR 
zugewiesen (0502) . 

Der MovePointer wird mit dem Wert von GP geladen. GP und 
MP referenzieren auf einen "BEGIN <ID>" -Befehl im CTR, 
auch wenn die erste KR/IKR aus dem CTR entfernt werden 
soil. Die betreffende ID wird in LUT2 als ungultig 
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markiert. MP wird so lange inkrementiert , bis das "BEGIN 
<ID>" des nachsten im Speicher liegenden KR/IKR erreicht 
wird (0503), ODER MP gleich dem FreePointer (FP) ist, 
das bedeutet, dali die zu entfernende KR/IKR die letzte 
im CTR ist (0504) . 

- In diesem Fall wird FP mit dem Wert von GP geladen, 
wodurch die durch die zu loschende KR/IKR belegten 
Speicherstellen als frei markiert werden; und die 
Funktion "REMOVE" ist beendet (0505) . 

- Andernfalls ("BEGIN <ID>" wird erreicht (0506)) werden 
die durch MP ref erenzierten Daten an die durch GP 

ref erenzierte Speicherstelle kopiert . MP und GP werden 
inkremetiert . Dieser Ablauf findet so lange statt, bis 
MP das Ende von CTR oder die Position von FP erreicht 
hat (0507) . Wird wahrend des Ablauf es durch MP eine 
Speicherstelle ref erenziert, in der "BEGIN <ID>" steht, 
wird der Eintrag fur die entsprechende ID in LUT2 mit MP 
iiberschrieben (0508), damit bei einem Lookup die 
richtige Speicherstelle ausgegeben wird. 

Figur 6 zeigt das Ablauf diagram des FILMOs. Ein FILMO 
beinhaltet drei Pointer: 

1. WriteP: Der Schreibzeiger des FILMO-RAM 

2. ReadP: Der Lesezeiger des FILMO-RAM 

3. FullP: Der Zustandszeiger, der den "Fullstand" des 
FILMO-RAMs reprasentiert und einen Unterlauf, bzw. 
tiberlauf verhindert. 

Ein ein-Bit Register "BeginF" zeigt an, ob sich der 
aktuelle Lesezugriff am Anfang des FILMO-RAMs befindet 
(TRUE), d.h. keine nicht geloschten Eintrage befinden 
sich zwischen dem Lesezeiger und dem Beginn des FILMO- 
RAMs; Oder sich der Lesezeiger in der Mitte des FILMO- 
RAMS befindet (FALSE), also benutzte Eintrage zwischen 
dem Lesezeiger und dem Beginn des FILMO-RAMS liegen. 
Weiterhin existieren zwei Register zum Speichern der 
Zustande des ReadP und FullP. Es' ist notwendig beim 



44 



wo 99/44147 



PCT/DE99/00504 



Auftreten des ersten ungeloschten Eintrages die beiden 
Register zu sichern, da bei einem spater stattf indenden 
Lesezugriff an der Stelle dieses Eintrages mit dem 
Auslesen begonnen werden mufi. Andererseits miissen jedoch 
ReadP und FullP wahrend des aktuellen Lesevorganges 
weiterhin modifiziert werden, um die nachsten 
Leseadressen zu erhalten, bzw. das Ende des FILMO-RAMs 
festzustellen. Durch den Aufbau des FILMOs als FIFO- 

ahnliche Struktur als sogenannten Ringspeicher 

kann Beginn und Ende des Speichers nicht anhand einer 
Adresse 0 oder eine Maximaladresse festgelegt werden. 
Aus dem Grundzustand fuhren zwei Ablaufpfade: 
1. Lesepfad (0601) 

FullP und ReadP werden in die Register gesichert. 
Die Abarbeitungsschleife beginnt : 
BeginF ist TRUE. 

1st FullP gleich 0, werden ReadP und FullP aus ihren 
Registern zuriickgelesen (0602) und die Statemachine 
springt in den Grundzustand zuruck. 

Ansonsten (0603) wird getestet, ob der Eintrag im FILMO, 
auf den ReadP zeigt gleich "NOP" ist, d.h. es handelt 
sich um einen als geloscht markierten Eintrag in der 
Mitte des FILMOs. Ist dies nicht der Fall (0604) wird 
versucht den Eintrag in das konf igurierbare Element 
(CEL) zu schreiben. Gelingt dies nicht (REJECT, 0605), 
da CEL nicht umkonf igurierbar ist, wird BeginF auf FALSE 
gesetzt, FullP dekrementiert und ReadP inkrementiert . 
Die Statemachine springt an den Beginn der 
Abarbeitungsschleife (0606) . 

Gelingt das Schreiben des Eintrages an das CEL (0607), 
Oder der Eintrag ist ein NOP, wird BeginF gestestet: 
BeginF == TRUE (0608) : Es liegen keine ungeloschten 
Eintrage vor diesem. FullP wird inkrementiert, ReadP 
wird in dem zugeordneten Register gesichert, um den 
neuen Anfang des FILMOs f estzuhalten . FullP wird 
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gesichert urn die aktuelle Datenraenge f estzuhalten; ReadP 
wird inkrementiert . 

BeginF == FALSE (0609) : FullP wird inkrementiert und der 
aktuelle Eintrag im FILMO-RAM mit NOP iiberschrieben, 
d.h. der Eintrag wird geloscht. ReadP wird 
inkrementiert. 

In beiden Fallen springt die Stateraachine an den Beginn 
der Abarbeitungsschleife . 
2. Schreibpfad (0610) 

Es wird getestet, ob der FILMO-RAM voll ist, indem FullP 
auf den maximalen Wert iiberpriift wird. 1st dies der Fall 
(0611), wird in den Lesepfad gesprungen um Platz zu 
schaf f en. 

Ansonsten wird das Datenwort in den FILMO-RAM 
geschrieben und WriteP und FullP inkrementiert. 

Figur 7 zeigt den Ablauf in der Hauptstatemachine . Der 
Grundzustand (IDLE) wird verlassen, sobald ein 

1. REMOVE-Kommando von der dariiberliegenden CT auftritt 
(0701) : Der REMOVE-Bef ehl wird ausgefiihrt und die 
Statemachine kehrt nach IDLE zuruck. 

2. Ein Triggersignal zur Generierung eines Triggers 
zwischen den CTs auftritt (0702) : 

Der Trigger wird ausgegeben. 

Die Statemachine springt in den "STOP"-Bef ehl und danach 
nach IDLE zuruck. 

3. Ein Triggersignal zur Ausfuhrung eines KR/IKR <ID> 
auftritt (0703) : 

Der ProgramPointer (PP) wird mit der durch LUT2 
generierten Adresse geladen. 1st die Adresse ungiiltig, 
d.h. kein Eintrag fur das zu ladende KR/IKR vorhanden, 
wird dieses geladen (0704) und PP neu gesetzt. 
Die Ausfiihrungsschleife beginnt: 

PP wird inkrementiert (beim ersten Schleifendurchlauf 
wird dadurch der BEGIN <ID>-Befehl ubersprungen) , das 
Auftreten weiterer Trigger wird unterbunden, RECONFIG 
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wird gesperrt. Die Befehle werden ausgefuhrt und zum 
Beginn der Ausfiihrungsschleife gesprungen (0707) . 
Der Befehl "STOP" wird gesondert ausgefuhrt (0705) . Die 
Trigger und RECONFIG werden wieder freigeschaltet und 
die Statemachine springt nach IDLE. 

Der Befehl "EXECUTE" wird ebenfalls gesondert ausgefuhrt 
(0706) . Die in EXECUTE <ID> angegebene ID wird in das 
ID-REG geschrieben. PP wird neu geladen und die durch ID 
angegebene KR/IKR ausgefuhrt (0708) . 

Nach einem Reset der CT wird die Grundkonf iguration in 
das CTR geladen und direkt in die Ausfiihrung der 
Grundkonfiguration gesprungen (0709) . 

Figur 8 zeigt den Aufbau eines SCRR-ARB. Die zu 
arbitrierenden Signale gelangen iiber Datain auf eine 
Maske (0801), die gemafl der bekannten Tabelle einen 
zusammenhangenden Teil der Signale durchschaltet, bzw. 
sperrt. Ein gewohnlicher PrioritMtsarbiter (0802) nach 
dem Stand der Technik arbitriert ein Signal aus der 
Menge der Durchgeschalteten und lieferte dessen 
BinSrvektor (BinaryOut) zusanmen mit einer 
giiltig/ungultig-Kennung (ValidOut) (ebenfalls gemafl dem 
Stand der Technik) als Ausgang des SCRR-ARB. 
Dieses Signal wird gemaB der bekannten Tabelle dekodiert 

(0803) und auf ein Register zur Taktsynchronisierung 

(0804) gefiihrt. Uber dieses Register wird die Datain 
Maske geschaltet. Dabei wird das Register entweder durch 
einen Takt oder ein Next-Signal (Enable EN), das den 
nMchsten gUltigen Binarvektor abfragt gesteuert. Bei 
einem Reset oder wenn die Kennung (ValidOut) ungultig 
anzeigt wird das Register so geschaltet, daB die Datain 
Maske alle Signale durchschaltet. 

Der Aufbau der Maske ist in 0805 dargestellt. In 0806 
ist die Maske ein weiteres Mai abgebildet, dabei sind 
die Signale Datain 0.. Datain 1 gemaB des SCRR-Prinzips 
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gleichpriorisiert, wahrend Datain m Datain n 
hoherpriorisiert sind, 

in Figur 9 ist die LUT-Struktur abgebildet. Der 
Binarvektor (Binaryln) des arbitrierten Triggers wird 
auf den Adresseingang der LUTl (0901) gefuhrt. 
LUTl ubersetzt den Binarvektor entweder in einen 
giiltigen Trigger um diesen an eine andere CT 
weiterzuleiten oder eine'gultige ID. Beide werden iiber 
0910 ausgegeben. 0911 zeigt an, ob es sich um einen 
Trigger oder eine ID handelt. 

1st iiber den Befehl "REFERENCE" keine Ubersetzung des 

eingehenden Binarvektors in LUTl eingetragen, wird 

mittels eines Biteintrages oder eines Vergleichers auf 

ein bestimmtes Token (z.B. "VOID") das Signal 

"Illegal Trigger" 0914 generiert. 

Ein Trigger wird iiber 0912 an externe CTs gefiihrt, IDs 
werden iiber den Multiplexer (0902) weiterverarbeitet . 
0902 schaltet entweder der Datenausgang von LUTl, der 
eine giiltige ID angibt, oder das ID-Register (0903) der 
CT auf den Adresseingang der LUT2 (0904) . 0904 besitzt 
eine Cache-ahnliche Struktur, d.h. der niederwertige 
Teil (0906) des Datenausgangs von 0902 wird auf den 
Adresseingang von 0904 geschaltet, wahrend der 
hoherwertige Teil (0907) auf den Dateneingang von 0904 
geschaltet wird. Der 0907 gehorende Datenausgang wird 
iiber einen Komparator (0905) mit 0907 verglichen. Der 
Vorteil dieses Verfahrens ist, dafi 0904 nicht die Tiefe 
zur IJbersetzung aller IDs aufweisen muii, sondern 
erheblich kleiner ausf alien kann. Ahnlich eines 
gewohnlichen Caches wird lediglich ein Teil der IDs 
iibersetzt, wobei in der LUT2 anhand 0907 festgestellt 
werden kann, ob die selektierte ID der von LUTl 
angegebenen entspricht. Dies entspricht einem Cache/TAG- 
Verfahren nach dem Stand der Technik. 
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Einem zweiten Dateneingang von 0904 ist ein Multiplexer 

0908 zugeordnet, der je nach Operation den FreePointer 
(FP, Operation LOAD), den GarbagePointer (GP, Operation 
REMOVE) Oder eine Invalid-Kennung/Token (NoAdr, 
Operation REMOVE) zur Speicherung an LUT2 liefert. Die 
beiden Pointer ref erenzieren auf Speicherstellen im CTR, 
"NoAdr" gibt an, dafi kein Eintrag zu der passenden ID 
existiert, der Eintrag geloscht wurde. Dies wird am 
Datenausgang f estgestellt , indem iiber den Vergleicher 

0909 die Daten auf das Token "NoAdr" verglichen werden. 
An die Statemachine wird weitergeleitet : 

- Das Auftreten eines Binarvektors wird iiber "Validin" 
(vgl. Figur 8) . 

- Die Angabe ob es sich bei der Ubersetzung in LUTl um 
einen Trigger oder eine ID handelt (0911, "Trigger/ID 
Out"). Trigger werden iiber 0912 an andere CTs 
weitergeleitet, IDs werden in der eigenen CT 
abgearbeitet und an die LUT2 weitergeleitet. 

- Das Ergebnis von 0905, das angibt, ob die 
entsprechende ID in 0904 gespeichert ist ("Hit/Miss 
Out") . 

- Das Ergebnis von 0909, das angibt, ob die 
entsprechende ID auf eine giiltige Adresse im CTR zeigt 
("NoEntry Out") . 

Die von 0904 generierte Adresse wird an das CTR 
weitergeleitet ("CTR Address Out"). 

Die LUTl wird iiber den Befehl "REFERENCE" mit der 
Ubersetzung des eingehenden Binarvektors auf einen 
Trigger oder ID geladen. Die Operanden des Befehls 
werden iiber den Bus 0913 an die LUTl gefiihrt. Uber 
denselben Bus wird das ID-Register (0909) geladen. 

Figur 10 zeigt die Pointerarithmetik des GarbagePointer 
(PG), ProgramPointer (PP), MovePointer (MP) und 
FreePointer (FP) . Jeder Pointer besteht aus einem 



49 



wo 99/44147 



PCT/DE99/00504 



getrennt ansteuerbaren ladbaren up/down-Zahler . Jeder 

Zahler kann sofern notwendig mit dem Wert jedes 

anderen Zahlers geladen werden; ebenso wie mit der 

Ausgabe von LUT2 (1007) . 

Uber Vergleicher wird festgestellt ob 

1. PP gleich MP 

2. MP gleich FP 

3. FP gleich der maximalen Position im CTR 
ist. Die Ergebnisse werden zur Steuerung der 
Statemachines verwendet . 

Uber einen Multiplexer (1001) wird einer der Pointer zum 
Adresseingang des CTR geleitet . Die Daten gelangen uber 
einen Multiplexer (1002) entweder von der ubergeordneten 
CT (1005) Oder aus einem Register (1003) an das CTR. Zur 
Statemachine und zum FILMO (1006) werden iiber einen 
Multiplexer (1004) entweder die Daten von der 
ubergeordneten CT oder des CTR weitergeleitet . Dabei 
wird beim Auftreten eines REMOVE-Bef ehls von der 
ubergeordneten CT der direkt iiber 1004 an die 
Statemachine geleitet, wahrend ansonsten die Befehle aus 
dem CTR an die Statemachine gefiihrt werden. Das Register 
1003 dient zur Speicherung und Riickkopplung von Befehlen 
auf den CTR Eingang, die wahrend eines Durchlaufs des 
Garbage-Kollektors von einer Adresse an eine andere 
geschoben werden . 

Der Aufbau eines FILMOs ist in Figur 11 dargestellt. Die 
Daten gelangen von dem CTR (1101) in das FILMO und 
werden entwerder liber den Multiplexer (1102) in das 
FILMO-RAM (1103) geschrieben oder iiber den Multiplexer 

(1104) an die konf igruierbaren Elemente (1116) gesendet. 
Werden Daten in 1103 geloscht, wird iiber 1102 eine 
"NOP"-Token nach 1103 geschrieben. Uber den Vergleicher 

(1105) am Datenausgang wird das "NOP"-Token erkannt und 
ein Schreiben zu den konf igurierbaren Elementen 
verhindert. iiber den Multiplexer 1106 wird entweder der 
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Schreibzeiger WriteP (1107) oder der Lesezeiger (1108) 
an den Adresseingang von 1103 gefiihrt. In dem Register 
1109 wird der Lesezeiger gesichert urn ein Riicksetzen 
(siehe Figur 6) zu ermoglichen. 

Der Fullstandszahler Full (1110) von 1103 wird gemaB 
Figur 6 in dem Register 1111 zum Rucksetzen gespeichert . 
Zwei Vergleicher testen, ob 1103 leer (1112) oder voll 
(1113) ist. Uber den Multiplexer 1115 wird selektiert, 
ob die Steuersignale der Statemachine (von 1101) oder 
des FILMOs an 1116 gesendet wird. 

Figur 12a zeigt den hierarchischen Aufbau der CTs. Alle 
CIS beziehen ihre Daten aus der ROOT-CT (1201) und dem 
ihr zugeordneten ECR (1204) . Fiir jede 

Implement ierungsebene in einem Baustein existiert eine 
Oder mehrere CTs. Jede CT ist fur die Verwaltung ihrer 
Ebene und der darunterliegenden CTs zustandig. Es ist 
nicht notwendig, dafi alle Aste das Baumes gleich tief 
sind. Beispielsweise konnen weniger Ebenen zur Steuerung 
der Peripherie (1202) eines Bausteines existieren als 
zur Steuerung der Arbeitseinheiten (1203). Der 
Datentransfer erfolgt baumartig. Jede CT arbeitet als 
Cache fur alle unter ihr liegenden CTs. 
Figur 12b zeigt den Triggerfluli zwischen den CTs. 
Wahrend der Datenfluli baumartig verlauft, ist der 
Triggerflufi nicht festgelegt. Jede CT kann an jede 
andere einen Trigger senden. Fiir gewohnlich findet ein 
Triggeraustausch nur von den Blattern (1203) in Richtung 
der ROOT-CT (1201) statt . Unter Umstanden kann der 
Transfer jedoch auch in die entgegengesetzte Richtung 
verlaufen. 

In Figur 12c ist ein Triggervektor Broadcast 
dargestellt, wobei 1205 einen Triggervektor an alle CTs 
sendet . 
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Figur 12d zeigt einen HIGHER-Triggervektor, den 1206 an 
die uber ihr liegende CT sendet . 1207 sendet einen 
LOWER-Triggervektor an alle unter ihr iiegenden CTs . 
1208 ubertragt einen direkt adressierten (ADDRESSED) - 
Triggervektor an eine bestimmte CT, die nicht direkt mit 
1207 verbunden ist. 

In Figur 13 fordern zwei unabhangige IKR n und m eine 
gemeinsame, in der dariiberliegenden CT gecachte KRx an. 
Es ist angedeutet, daii diese KR von dem gesamten Ast 
gecachet wird und auch in einem Nachbarast (1301) iiber 
eine gemeinsame CT verfugbar ist. 

Figur 14 zeigt ein gegeniiber Figur 9 modif iziertes LUT- 
System, das in ROOT-CTs und CTs mittlerer 
Hierarchieebenen verwendet wird. Der grundlegende 
Unterschied zu den bislang beschriebenen CTs ist, dafi 
anstatt einzelner Triggersignale ID- und/oder Trigger- 
Vektoren von der CT verwaltet werden raussen. Jedem 
Vektor ist dabei ein Handshake-Signal (RDY) zur Anzeige 
der Gultigkeit des Vektors zugeordnet, die an einen 
Arbiter (1401) geleitet werden, Uber die Multiplexer 
(1402, 1403) wird entweder einer der Triggervektoren 
(1404) Oder einer der ID-Vektoren (1405) ausgewahlt. 
Triggervektoren gelangen direkt auf den Adresseingang 
der LUTl (1406), die ansonsten gemafi Figur 9 beschaltet 
ist. Das ID-Register (1407) ist ebenfalls gemafi Figur 9 
beschaltet. Im Gegensatz zu Figur 9 besitzt der 
Multiplexer 1408 drei Eingange (vgl . 0902). Der 
Multiplexer wird dabei aulier von der Statemachine 
zusatzlich von dem Arbiter 1401 angesteuert . Uber den 
zusatzlichen Eingang werden ID-Vektoren iiber 1403 direkt 
an die LUT2 weitergeleitet . Dazu dient der Bus 1409. 
(Prinzipiell konnen auch bei CTs gemafi Figur 9 IDs gemaB 
einem Multiplexer (1408) direkt auf die LUT2 geschaltet 
werden. Die IDs konnen dann ohne Ubersetzung direkt von 
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den CEL an die LUT2 gesendet werdenj "Trigger/ID Out" 
wird gemaB Figur 9 generiert, Ein "Validin" Signal, das 
gemafi Figur 9 auf ein "Valid Out" weitergeleitet wird 
existiert nicht. Statt dessen wird je nach Arbitrierung 
durch 1401 ein "Valid Trigger Out" fiir Triggervektoren 
und ein "Valid ID Out" fiir ID-Vektoren generiert, um die 
Statemachine anzuweisen, wie die Verarbeitung 
stattzuf inden hat. 

Der Bus 1409 wird iiber 1410 an eine weitere Einheit 
geleitet, die nur in der ROOT-CT existiert und in Figur 
15 beschrieben ist. 

Eine ROOT-CT benotigt zusatzlich zu den normalen CT- 
Funktionen ein Interface zu dem externen 
Konfigurationsspeicher (ECR) , sowie den erf orderlichen 
Adressgenerator und Einheiten zum Verwalten der Zugriffe 
auf den ECR. 

Eine gewohnliche CT iibersetzt in LUTl eingehende 
Triggervektoren auf einen ID und in LUT2 das ID auf eine 
Speicherstelle im CTR (siehe Figur 16a) . Eine ROOT-CT 
iibersetzt bei Zugriffen auf das ECR eine ID innerhalb 
des ECR auf eine Adresse im ECR, an der das durch ID 
referenziert KR/IKR beginnt. Dazu ist ein 
Speicherbereich im ECR festgelegt, dessen Grofie der 
moglichen Anzahl an IDs entspricht (ist beispielsweise 
eine ID 10-bit breit, ergibt das 2^** = 1024 mogliche IDs, 
also werden 1024 Eintrage im ECR reserviert) • In den 
folgenden Beispielen befindet sich dieser 
Speicherbereich am unteren Ende des ECRs und wird LUT- 
ECR genannt, um die Ahnlichkeit zur LUT2 zu 
unterstreichen. Die Ubersetzung eines Triggers auf eine 
ID findet dabei gemali den bereits bekannten CTs in der 
LUTl statt (1601) . Zum besseren Verstandnis verdeutlicht 
Figur 16b den Zugriff auf das ECR. 
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Eine ID gelangt in Figur 15 iiber den Bus 1410 auf Figur 
14 an den Multiplexer 1501. fiber 1501 wird die ID in den 
ladbaren Zahler 1502 geschrieben. Der Ausgang von 1502 
fiihrt iiber einen Multiplexer 1503 an den Adressbus 
(1504) des ECR. Uber den Datenbus 1505 gelangt die 
Ubersetzung der ID auf eine Speicheradresse iiber einen 
Multiplexer/ Demultiplexer (1506) an 1501, der 1502 mit 
der Speicheradresse ladt. Daraufhin werden iiber die 
Statemachine LOAD-ECR (siehe Figur 17) die Datenworter 
der entsprechenden KR/IKR aus dem ECR gelesen und in das 
CTR geschrieben, wobei 1502 nach jedem Lesevorgang 
erhoht wird; so lange, bis der Befehl "STOP" gelesen 
wurde . 



Uber das Interface 1507 schreibt der ubergeordnete HOST 
iiber 1503/1506 die KR/IKR in das ECR. Dabei wird iiber 
die Statemachine (CTS) arbitriert, ob der HOST Oder die 
ROOT-CT Zugriff auf das ECR hat. 

Nach einem Reset des Bausteines mufi eine 
Grundkonfiguration (BOOT-KR) geladen werden. Dazu wird 
eine feste Speicheradresse (BOOT-ADR) eingefiihrt, die 
auf die erste Speicherstelle der BOOT-KR zeigt. Als 
BOOT-ADR wird die Speicherstelle Oh empfohlen, sofern 
die IDs bei 1 beginnen, andernfalls kann 2" oder irgend 
eine andere Speicherstelle verwendet werden. In dem 
Ausfiihrungsbeispiel wird 2'° verwendet. 

Die ROOT-CT fiihrt zum Laden der BOOT-KR an der Stelle 
BOOT-ADR einen Lookup durch, sofern eine BOOT-KR geladen 
ist. Die ROOT-CT schreibt die Daten nach 1502 um von 
dort die BOOT-KR bis zum Auftreten eines "STOP" Befehls 
zu laden. 

Eine Uberwachungseinheit innerhalb der ROOT-CT iibernimmt 
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die Synchronisation des HOST mit dem Baustein. Dies 
geschieht f olgendermaaen: 

Die Adressen kleine 2^° warden durch 1508 iiberwacht, d.h. 
bei Zugriffen auf diese Adressen durch den HOST wird ein 
Signal (ACC-ID) an die Statemachine (CTS) gesendet. 
Ebenfalls wird BOOT-ADR uber 1509 iiberwacht und sendet 
ein Signal ACC-BOOT an die Statemachine (CTS) . 
Die Statemachine (CTS) reagiert wie folgt: 

- Schreibt HOST auf die BOOT-ADR, bewirkt dies das Laden 
der BOOT-KR. 

- Schreibt HOST das Datenwort 0 (1512) auf die BOOT-ADR, 
wird dies iiber den Komparator 1510 festgestellt und 
bewirkt das Anhalten des Bausteines. 

" schreibt der HOST auf eine Adresse kleiner 2^^ wird die 
Adresse in das REMOVE-Register (1511) geladen. Da die 
Adresse der ID entspricht (siehe ECR-LUT) steht die ID 
der geanderten KR/IKR in 1511. An alle CTs wird der 
Befehl REMOVE <ID> zur sofortigen Ausfuhrung gesendet 
(1513) . Die CTs loschen daraufhin die KR/IKR der 
entsprechenden ID aus ihrem CTR, bzw. LUT2. Bei einera 
nachfolgenden Aufruf der KR/IKR mussen die CTs 
zwangslaufig die neue KR/IKR aus dem ECR laden. 

Figur 17 zeigt den Ablauf in einer ROOT-CT bei Laden 
einer KR/IKR aus dem ECR. Befindet sich eine ID nicht im 
internen CTR (vgl. Figur 1, 1701) wird die ID in den 
Zahler 1502 geschrieben (1703) . Ein Zugriff auf das ECR 
mit der Adresse in 1502 liefert die Basisadresse der 
KR/IKR. Diese wird in 1502 geschrieben (1704). Ein LOAD 
gemafi Figur 2 findet statt (1702) . Dabei werden die 
Daten statt von einer Ubergeordneten CT aus dem ECR 
gelesen (1705) und nicht nur in das eigene CTR 
geschrieben, sondern an die untergeordnete CT gesendet 
(1706) . 
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In einer CT mittlerer Hierarchieebene lauft die 
Ubersetzung der Trigger ahnlich Figur 1, mit der 
Ausnahme, daS> Triggervektoren und ID-Vektoren gemafi 
Figur 14 behandelt werden. Die KR/IKR werden gemafi Figur 
2 geladen, rait der Ausnahme, dafi die Datenworte nicht 
nur in das eigene CTR geschrieben werden (0210), sondern 
gleichzeitig an die untergeordnete CT gesendet werden. 

Figur 19 verdeutlicht das FILMO Prinzip, Der FILMO 
(1901) wird bei lesenden und schreibenden Zugriffen 
iramer vom Anfang zum Ende durchlaufen (1902) . Werden 
Eintrage vom Anfang des FILMOs geschrieben und geloscht 
(1903), wird der Lesezeiger auf den ersten ungeloschten 
Eintrag verschoben (1904) . Werden Eintrage aus der Mitte 
das FILMOs geschrieben (1905), bleibt der Lesezeiger 
unverandert (1906), die Eintrage werden mit "NOP" 
markiert (1907) . Werden Oaten in das FILMO geschrieben 
(1908), werden diese am Ende, hinter dem letzten Eintrag 
angehangt (1909) . Der Lesezeiger (1910) bleibt 
unverandert . 

Selbstverstandlich kann eine CT mit nur einem Speicher, 
der LUTl, LUT2 und CTR umfafit aufgebaut werden. Die 
Steuerung dafiir ist jedoch aufwendiger. Die CTs sind 
dabei ahnlich der ROOT-CT aufgebaut, die bereits die 
LUT2 UND das CTR im ECR integriert . Fur das Verstandnis 
des Verfahrens ist eine Beschreibung dieser CTs nicht 
erforderlich. 

Wird eine CT als Cachesystem filr Daten eingesetzt, 
werden Trigger zum Schreiben von Daten in das CTR 
eingefiihrt. Dabei werden die Daten von einer CEL in das 
CTR geschrieben. Die hierzu notwendigen Anderungen sind 
trivial, das FILMO kann komplett ent fallen, 
Beim Cachen der Daten tritt das Problem der 
Datenkonsistenz auf. Dies kann umgangen werden, indem 
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ein Verfahren geraaii DE 42 21 278 Al eingesetzt wird, urn 
die Daten und deren Gultigkeit in den einzelnen 
Hierarchieebenen zu kennzeichnen. Werden Daten zur 
Durchfuhrung eines Read-Modify-Write-Zyklusses (RMW- 
Zyklus) angefordert, werden die Daten auf alien 
Hierarchieebenen anhand eines zusatzlichen Eintrages in 
dem CTR/ECR als "ungiiltig" (INVALID) gekennzeichnet . In 
den Eintrag kann dazu die eindeutige ID der die Daten 
benutzenden KR/IKR eingetragen werden. Die Daten konnen 
so lange von keiner KR/IKR mit anderer ID benutzt 
werden, bis die die Daten benutzende KR/IKR die Daten 
zuruckgeschrieben (vgl. Write-Back-Methode nach dem 
Stand der Technik) und ihre ID geloscht hat. 

Figur 20 zeigt ein Ausfiihrungsbeispiel : 
In Figur 20a fordert die CT 2007 Daten von der 
dariiberliegenden CT an, diese fordert die Daten von der 
ROOT-CT 2004; mit der Datenanf orderung wird die ID der 
Anfordernden KR/IKR (2001) ubertragen. Die Daten (2002) 
werden an 2007 gesendet. Alle anderen, spateren Zugriffe 
werden abgewiesen (2003) . 

In Figur 20b werden die Daten zuruckgeschrieben (2005), 
anderen, spateren Zugriffe werden wieder akzeptiert 
(2006). 

In Figur 20c werden Daten von einer CT mittleren 
Hierarchie angefordert, im Besitz der Daten ist und 
diese an 2007 sendet. Die ID zum Sperren der Daten wird 
an alle CTs in der Hierarchie gesendet (2001) . Beim 
Riickschreiben der Daten (Write-Back) in Figur 20d werden 
die Daten an alle CTs in der Hierarchie geschrieben und 
die ID geloscht. 

Figur 21 zeigt die Kommunikation einer INITIATOR CT 
(2101) iaber mehrere Zwischen-CTs (2104, 2105, 2106) mit 
einer TARGET CT (2102), sowie die direkte Kommunikation 
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ohne Zwischenebenen mit einer TARGET CT (2103) nach dem 
GETCTS/LOOSECTS-Verf ahren . 

2101 baut eine Verbindung zu 2103 auf. Nach 
erfolgreichen Aufbau erhalt 2101 von 2103 einen GRANT 
als Bestatigung des Aufbaus . Danach baut 2101 iiber 2104, 
2105, 2106 die Verbindung zu 2102 auf. Die Verbindung zu 

2102 wird erst bestatigt (GRANT) , wenn 2102 erreicht 
ist . 

1st die Verbindung nicht aufbaubar, da einer der Busse 
belegt ist, wird ein REJECT an 2101 gesendet und 2101 
bricht den Vorgang ab. Das bedeutet, daft auch die 
Verbindung zu 2103 abgebrochen wird und ein REJECT an 

2103 gesendet wird. 

Bestatigt 2102 jedoch die Verbindung mit GRANT, sendet 

2101 an 2103 und 2102 eine GO-Befehl, um gleichzeitig 
2103 und 2102 den gelungenen Busaufbau und die 
Synchonisation zu bestatigen. Durch dieses ProtoJcoll 
sind Daten oder Befehle synchron und deadlockfrei 
iibertragbar, da uber GO sichergestellt ist, dafi alle 
TARGET die Befehle korrekt empfangen. 

Figur 22 zeigt den Ablauf der Inter-CT-Kommunikation 
nach dem GETBUS/LOOSEBUS-Verf ahren. Wahrend im Verf ahren 
gem. Fig. 21 die jeweils ubergeordneten CTs die 
steuernde und pridrisierende Aufgabe besitzen, wird die 
Steuerung hier von den Inter-CT-Bussen (2201) 
iiber nommen . 

Eine Verbindung zu 2103 wird aufgebaut, indem die 
INITIATOR-CT (2101) ihren lokalen Inter-CT-Bus anfordert 
(2202) , Anforderungen werden bestatigt, wenn der Bus 
frei ist (ACCEPT) oder zuriickgewiesen, wenn der Bus 
belegt ist (REJECT) . Danach sendet sie die Adresse von 

2102 auf den Bus. Gemafi dem Adressierungsschema erkennt 
die Bussysteuerung, daft die Adresse aufierhalb der 
lokalen Busadressen liegt und baut iiber die 
iibergeordnete CT 2104 eine Verbindung zu deren lokalem 
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Bus auf (2203) . Da die Adresse von 2102 in dessen 
Adressbereich liegt, wird uber 2106 die Verbindung zura 
lokalen Bus von 2102 aufgebaut (2204). Da 2101 nunmehr 
alleiniger Busmaster samtlicher fur die 
Datenkommunikation erforderlicher Busse ist, ist 
sichergestellt, daJi eine reibungslose deadiockf reie 
Kommunikation ablauft, da die KommunikationskanMle fiir 
alle anderen CTs gesperrt sind. Auch 2102 und 2103 
konnen die Busse nicht benutzen, da diese in ihrer 
TARGET-Rolle nur Befehle empfangen konnen und nur auf 
Anforderung durch den INITIATOR (2101) selbst Daten 
senden konnen. 

Sobald die Kommunikation beendet ist, werden die Busse 
durch ein Signal von 2101 abgebaut. 

Trifft 2101 wahrend des Busaufbaus auf einen benutzten 
Bus, wird ein REJECT an 2101 gesendet und 2101 baut die 
Bussysteme wieder ab und versucht den Aufbau zu einem 
spateren Zeitpunkt erneut. Forderen mehrere CTs 
gleichzeitig denselben Bus an, so ist die iiberliegende 
CT hoher priorisiert (2205) . Damit wird vermieden, dafi 
ein weit fortgeschrittener Busaufbau, der bereits uber 
mehrere Ebenen lauft von einem noch sehr lokalen 
Busaufbau abgebrochen wird. 

Durch ein erweitertes Protokoll ist es mSglich im Falle 
eines REJECTS nur die Busse abzubauen, die von dem hoher 
priorisierten Busaufbau benotigt werden. Dies kann zu 
einer erheblichen Performancesteigerung fiihren, da nicht 
alle Busse zu einem spateren Zeitpunkt neu aufgebaut 
werden mvissen. 

Der Aufbau des Inter-CT-Busses fiir das Verfahren gem. 
Fig. 22 ist in Figur 23 dargestellt. Die CTs 2301-2304 
sind uber ihre Interface (2308-2311) zusammen mit der 
Ubergeordneten CT 2305 (Interface 2307) an den Inter-CT- 
Bus 2312 angeschlossen. Die Aufschaltung auf den Inter- 
CT-Bus geschieht Uber einen Round-Robin-Arbiter, der 
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2308-2311 gleich priorisiert und 2307 hoher priorisiert, 
der einen Multiplexer zum Zusammenschalten der Busse 
ansteuert (2306) . Dem Arbiter zugeordnet ist ein 
Statemachine, die die Steuersignale (z.B. Auf/Abbau, 
ACCEPT, REJECT. . . ) auswertet . 

Figur 24 zeigt den Aufbau des Adresschemas eines 
eindimensionalen CT-Baumes. Die Rechtecke symbolisieren 
eine CT. Dabei ist die Adresse der CT eingetragen. - 
kennzeichnet unrelevante Adressbits, die nicht 
ausgewertet werden, die relevanten Adressbits sind mit 
binarer 0 oder 1 angegeben, * steht fur jedes beliebige 
Adressbit. Es ist leicht nachvollziehbar, dafi durch 
Projektion dieses Schema auf mehrdimensionale Baume 
ebenso angewendet werden kann, dabei stellen die 
angegebenen Adressen jeweils eine der Achsen dar; mit 
anderen Worten, pro Achse existiert ein entsprechendes 
separates Adressystem. 

Figur 24a zeigt die Adressierung von CT 0001 aus. Dabei 
ist die relative Adresse -1 angegeben. Durch die 
Berechnung -1+1 - 00 ("relative Bewegung" + "Adresse 
der INITIATOR-CT auf aktueller Ebene"), kann die CT 0000 
berechnet werden, die auf denselben lokalen Bus 
geschaltet ist. 

In Figur 24b ruft die CT 0010 die relative Adresse +10 
auf. Die Berechnung 10+0 - 10 ("relative Bewegung" + 
"Adresse der INITIATOR-CT auf aktueller Ebene") ergibt 
den Ubertrag 1, da der Adressbereich des niedersten 
lokalen Busses genau ein Bit breit ist. Dadurch wird der 
nachst hohere Bus selektiert. Dessen Adressberechnung 
ergibt mit 10+10 = 100 ("relative Bewegung" + "Adresse 
der INITIATOR-CT auf aktueller Ebene") erneut einen 
Ubertrag, da dessen Adressbereich mit 2 Bit urn genau 
eins grofier ist, als der Adressbereich des niedersten 
Busses. Auf der nachsthoheren Ebene tritt bei der 
Berechnung 10 + 010 = 0100 kein Ubertrag auf, sodali das 
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3. Bit (von links) den Pfad 1** mit der nachst tieferen 
Ebene adressiert, das 2. Bit (von links) den Pfad 10* 
der wiederum nachst niedersten Ebene adressiert- und 
schlieBlich das letzte Bit die TARGET-CT selektiert. 
Figur 24c zeigt das bekannt Verfahren iiber 2 Ebenen in 
positive Richtung und Figur 24d zeigt das Verfahren iiber 
drei Ebenen in negativer Richtung mit negativem 
Uberlauf . 

Figur 25 zeigt den Aufbau eines 2-dimensionalen CT- 
Baumes. Auf der untersten Ebene (2502) befinden sich 2- 
dimensional angeordnet die CTs (2501) . Die Adresse der 
Dimension ist mit x/y in der jeweiligen CT angegeben. 
2502 iibergeordnet ist die nachsthohere Ebene (2504) . 
Deren CTs (2503) steuern jeweils eine Gruppe von 4 CTs 
der Ebene 2502. Der Adressraum der CTs auf 2504 ist urn 
ein Bit weiter, * kennzeichnet die Adressbits der Ebene 
2502, die fiir die Selektion der CTs auf 2504 irrelevant 
sind. 2504 iibergeordnet befindet sich die ROOT-CT 2505. 
Deren Adresse ist wiederum urn ein Bit weiter, die 
Bedeutung von * ist equivalent. 

Figur 26 zeigt die Verkettung des Garbage-Kollektors bei 
der Mikrokontroller-Implementierung. Dabei sind 
samtliche KRs miteinander iiber die Headereintrage 
(garbage-previous/garbage-next) miteinander verkettet . 
Beim Durchlaufen des Garbage-Kollektors durch die Liste, 
wird das Alter der KR durch Erh.ohen des Eintrages um 
(+1) fiir die Cache-Statistik (2602) protokolliert . Der 
Garbage-Kollektor achtet auf den Eintrag KR-Statistik 
(2601), der anzeigt, ob die KR noch in der FILMO-Liste 
hangt. In diesem Fall darf die KR nicht von GC geloscht 
werden, da sie noch unkonf igurierte KW enthalt. 
Alternativ konnte dieser Test auch iiber die Eintrage 
FILMO-next und FILMO-previous ablaufen. 
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In Figur 27 ist die Verkettung der FILMO-Liste 
dargestellt . 

Dabei kann die Verkettung eine vollkommen andere als in 
der Garbage-Liste (Fig. 26) sein. Die KRs sind uber 
FILMO-previous und FILMO-next verkettet. Die Eintrage 
KR-Statistik (2701) zeigen auf das jeweils erste noch 
nicht konfigurierte KW in der jeweiligen KR. Ein FILMO- 
Lauf gestaltet sich derart, dal5 in der ersten ID die KR 
gestartet wird. Nach Ausfiihrung wird die Position des 
nicht ausgefiihrten KW nach 2701 geschrieben. Sollte KR 
komplett ausgefuhrt worden sein, wird das KR aus der 
verketteten FILMO-Liste entfernt, verbleibt aber im 
Speicher. Danach wird iiber die FILMO-Liste zu dem 
nachsten KR gesprungen, das ebenso verarbeitet wird. 

Figur 28 verdeutlicht den Aufbau einer KR bei 
Mikrokontrollersteuerung. Zu Beginn steht ein 
Sprungbefehl, der hinter den Header (2801) der KR 
springt. Jedem KW zugeordnet ist das FILMO-Bit (2802). 
Eine 1 (2803) zeigt an, daB das KW von den CEL 
akzeptiert wurde (ACCEPT) und beim nachsten Durchlauf 
nicht mehr ausgefuhrt wird. Eine 0 (2804) zeigt einen 
REJECT an, das KW muli beim nachsten Durchlauf erneut 
ausgefuhrt werden. Die optionale KR-Statistik (2701) 
zeigt auf das erste mit 0 gekennzeichente KW. Erhalt 
PUSHRET (2805) einen REJECT, wird die Abarbeitung des KR 
hier abgebrochen und beim nachsten Durchlauf entweder 
beim ersten KW oder an der Stelle auf die 2701 zeigt neu 
aufgesetzt. Ansonsten wird das KR an dessen Ende bei 
2806 ordentlich verlassen. 

Figur 29 zeigt die Schaltung zum Sichern der 
Statusinformationen einer CEL vor dem Durchlaufen des 
FILMOs Oder Starten einer KR. Die Statusinf ormation 
gelangt aus der CEL (2901) auf ein Register (2902). Vor 
dem Durchlaufen des FILMOs oder Starten einer KR sendet 
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die CT ein Freigabesignal (2903) an 2902. Daraufhin wird 
die Statusinf ormation ubernommen und an die CT 
weitergeleitet (2904). 2904 bleibt konstant bis zum 
nachsten Absenden von 2903. 
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Begriffsdefinition 



ACCEPT Signal, das anzeigt, dafi die adressierte CEL 
sich in einem konf igurierbaren Zustand befindet und das 
gesendete KW annimmt. 

Block-Befehle (u. a. BLOCK-MOVE) Befehle, die eine 
Mehrzahl von Daten (einen Block) im Speicher oder 
zwischen Speicher und Peripherie verschieben. Dabei wird 
die Herkunftsadresse der zu verschiebenden Daten, die 
Zieladresse der Daten und die Lange das Datenblocks 
angeben . 

Broadcast Senden einer Information an eine Vielzahl 

von Empfangern. 

Datenen^fanger Die Einheit(en), die Ergebnisse der 

CEL weiterverarbeitetZ-arbeiten 

Datensender Die Einheit (en) , die Daten fur die CEL 
als Operanden zur Verfugung stellt/stellen 

Datenwort Ein Datenwort besteht aus einer beliebig 

langen Bit-Reihe. Diese Bit-Reihe stellt eine 
Verarbeitungseinheit fur eine Anlage dar. In einem 
Datenwort konnen sowohl Befehle fiir Prozessoren o.a. 
Bausteine sowie rein Daten kodiert werden. 

Deadlock Zustand, indem aufgrund gegenseitiger 

Blockade keinerlei Datenverarbeitung moglich ist. 

DFP Datenfluiiprozessor nach Patent/Of fenlegung DE 

44 16 881 

DPGA Dynamisch konf igurierbare FPGAs. Stand der 

Technik 



54 



wo 99/44147 



PCT/DE99/00504 



Elemente Sammelbegrif f fiir alle Arten von in sich 

abgeschlossenen Einheiten, welche als Stuck in einem 
elektronischen Baustein zum Einsatz kommen konnen, 
Elemente sind also: 

- Konfigurierbare Zellen aller Art 

- Cluster 

- RAM-Blocke 

- Logik 

- Rechenwerke 

- Register 

- Multiplexer 

- I/O Pins eines Chips 

Ereignis Ein Ereignis kann durch ein 

Hardwareelement in irgendeiner zur Anwendung passenden 
Art und Weise ausgewertet werden und als Reaktion auf 
diese Auswertung eine bedingte Aktion auslosen. 
Ereignisse sind somit zum Beispiel: 

- Taktzyklus einer Rechenanlage. 

- internes oder externes Interrupt-Signal . 

- Trigger-Signal von anderen Elementen innerhalb des 
Bausteines . 

- Vergleich eines Datenstroms und/oder eines 
Befehlstroms mit einem Wert. 

- Input /Output Ereigenisse. 

- Ablaufen, liberlaufen, neusetzen etc. eines Zahlers. 

- Auswerten eines Vergleichs. 

FIFO First-In, First-Out Speicher nach dem Stand 

der Technik 

FILMO Abgewandeltes FIFO, aus dem linear Daten 
gelesen werden. Eine Beschrankung des Lesezeigers auf 
den Beginn des Speichers ist nicht vorhanden. 
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FPGA PrograiTunierbarer Logikbaustein . Stand der 

Technik. 

F-PLUREG Register in dem die Funktion der CEL gesetzt 
wird. Ebenfalls wird der OneShot- und Sleep-Mode 
gesetzt. Das Register wird von der PLU beschrieben. 

Fragmentierung Zerteilen von Speicher in eine 

Vielzahl oftmals kleiner und damit nutzloser 
Speicherbereiche . 



Garbage-Kollektor Einheit zum Verwalten des Speichers. 
Verhindert eine Fragmentierung. 

H-Pegel Logisch 1 Pegel, abhangig von der verwendeten 
Technologie 

HOST Einem Baustein Oder Baugruppe libergeordneter 

Rechner . 



IDLE-Zyklus Zyklus, in dem eine Statemachine keine 
Verarbeitung durchfiihrt. Grundzustand einer 
Statemachine , 

INITER-CT-BUS Bussystem zwischen den CTs einer Ebene 
und einer hoherliegenden CT (oder CT-Gruppe) . 

INITIATOR CT, die einen Zugriff auf den Inter-CT- 

Bus startet.. 

Pointer Zeiger auf eine Adresse bzw. ein 

Datenwort . 



kontigurierbares Element (KE) Ein konf igurierbares 

Element stellt eine Einheit eines Logik-Bausteines dar, 
welche durch ein Konf igurationswort fiir eine spezielle 
Funktion eingestellt werden kann. Konf igurierbare 
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Elemente sind somit, alle Arten von RAM Zellen, 
Multiplexer, Arithmetische logische Einheiten, Register 
und alle Arten von interner und externer 
Vernetzungsbeschreibung etc.} 

konfigurierbare Zelle (CEL) Siehe Logikzellen 

Konfigurieren Einstellen der Funktion und 

Vernetzung einer logischen Einheit, einer (FPGA) -Zelle 
Oder einer CEL (vgl. umkonfigurieren) . 

Konfigurationsdaten Beliebige Menge von 

Konf igurationsworten . 

Konfigurationsroutine (KR) Mehrere Konf igurationsworte 
zu einem Algorithmus zusammengefugte . 

Konfigurationsspeicher Der Konf igurationspeicher 

enthalt ein oder mehrere Konf igurationsworte. 

Konfigurationswort (KW) Ein Konf igurationswort 

besteht aus einer beliebig langen Bit-Reihe. Diese Bit- 
Reihe stellt eine giiltige Einstellung fur das zu 
konfigurierende Element dar, so das eine funktionsf ahige 
Einheit entsteht. 

Ladelogik Einheit zum Konfigurieren und 

Umkonfigurieren der CEL. Ausgestaltet durch einen 
speziell an seine Aufgabe angepaliten Mikrokontroller . 

Logikzellen Bei DFPs, FPGAs, DPGAs verwendete 
konfigurierbare Zellen, die einfache logische oder 
arithmetische Aufgaben gemafi ihrer Konf iguration 
erfiillen. 
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Lookup-Tabelle Stand der Technik. Verfahren zum 

Ubersetzen von Daten. 

LUTl Lookup-Tabelle, die einen Trigger auf eine ID 

libersetzt und feststellt, ob der Trigger einer giiltigen 
ID zugeordnet ist. 

1. UT2 Lookup-Tabelle, die eine ID auf die Adresse 
der entsprechenden KR im lokalen Speicher iibersetzt und 
feststellt, ob die KR im lokalen Speicher vorhanden ist. 

L-Pegel Logisch 0 Pegel, abhangig von der verwendeten 
Technologie 

Masks Bitkombination, die die giiltigen Signale 
innerhalb einer Mehrzahl von Signalen angibt . 

Priori siening Festlegung einer Reihenfolge. 

RECONFIG Rekonfigurierbarer Zustand einer CEL. 

RECONFIG-Trigger Setzen einer CEL in den 
rekonf igurierbaren Zustand. 

REJECT Signal, das anzeigt, daft die adressierte CEL 
sich in einem nicht konf igurierbaren Zustand befindet 
und das gesendete KW nicht annimmt. 

REMOVE-<ID> 1, Befehl innerhalb eines KR zum 
Entfernen der durch ID ref erenzierten KR. 

2. Befehl einer iibergeordneten CT uber ein separates 
Interface oder Handshaking an eine untergeordnete CT zum 
loschen der durch ID ref erenzierten KR. 

RESET Riicksetzen eines Bausteines oder eines ganzen 
Computersy stems in einen definierten Grundzustand. 
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ROOT-CT CT der hochsten Hierarchieebene mit direktem 
Zugriff auf den externen Konf igurationsspeicher . 

Round-Robin-Arbiter Arbiter der im Kreis lauft und 

inrnier dem zuletzt arbitrierten Signal die niederste 
Prioritat zuordnet. 

Statemachine siehe Zustandsmaschine . 

Synchronisationssignale Statussignale die von einem 

konfigurierbaren Element oder einem Rechenwerk generiert 
werden und zur Steuerung und Synchronisation der 
Datenverarbeitung an weitere konf igurierbare Element 
Oder Rechenwerke weitergeleitet werden, Es ist auch 
moglich ein Synchronisationssignal zeitlich verzogert 
(gespeichert) an ein und dasselbe konf igurierbare 
Element oder Rechenwerk zuriickzuleiten , 

TARGET CT, die einen Ziel eines Zugriffs auf den 

Inter-CT-Bus ist. 

Trigger Synonym fiir Synchronisationssignale. 

Umkonfigurieren Neues Konf igurieren von einer 
beliebigen Menge von CELs wahrend eine beliebige 
Restmenge von CELs ihre eigenen Funktionen fortsetzen 
(vgl. konf igurieren) . 

Verkettete-Liste Uber Pointer zusammengef ugte 
Datenstruktur nach dem Stand der Technik. 

Zellen Synonym fiir konf igurierbare Elemente 

Zustandsmaschine Logik, die diversen Zustanden 

annehmen kann. Die Ubergange zwischen den Zustanden 
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sind von verschiedenen Eingangsparametern abhangig. 
Diese Maschinen werden zur Steuerung komplexer 
Funktionen eingesetzt und entsprechen dem Stand der 
Technik. 
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Patentanspriiche 

1. Verfahren zum Cachen von Befehlen in aus mehreren 
Rechenwerken bestehenden Mikroprozessoren und in 
Bausteinen mit zwei- oder mehrdimensionaler 
Zellanordnung (z.B. FPGAs, DPGAs, DFPs, o.dgl.), dadurch 
gekennzeichnet , daB 

1.1 mehrere Zellen und Rechenwerke (CEL) zu einer 

Mehrzahl von Gruppen zusanunengef afit werden, 
wobei jeder Teilgruppe eine Cache-Einheit (CT) 
zugeordnet ist, 

1.2 die Cache-Einheiten der einzelnen Teilgruppen 

werden uber eine Baumstruktur an eine 
ubergeordnete Cache-Einheit (ROOT-CT) 
geschaltet, die Zugriff auf den 
Befehlsspeicher Speicher (ECR) besitzt, in dem 
die Befehle abgelegt sind, 

1.3 Befehle werden zu Bef ehlssquenzen (KR) 

zusammengefaBt, die immer als ganze gecachet 
und zwischen den Caches iibertragen werden, 

1.4 jede Cache-Einheit auf unterster oder mittlerer 

Ebene des Baumes fordert die benotigten 
Befehle bei der jeweils ubergeordneten Cache- 
Einheit an, 

1.5 eine ubergeordnete Cache-Einheit sendet eine 

angeforderten Bef ehlssequenzen an die 
untergeordnete Einheit, sofern sie die 
Befehlssequenzen in ihrem lokalen Speicher 
halt, 

1.6 eine ubergeordnete Cache-Einheit fordert eine 

angeforderten Befehlssequenzen bei der ihr 
ubergeordneten Cache-Einheit an, sofern sie 
die Befehlssequenzen nicht in ihrem lokalen 
Speicher halt. 
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2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , 
daB 

Befehlssequenzen als Ganze geloscht warden. 

3. Verfahren nach Anspruch 1 bis 2, dadurch 
gekennzeichnet , da5 

Befehlssequenzen einer Cache-Einheit geloscht werden, 
wenn nicht geniigend Platz zum Laden einer weiteren 
angeforderten. Bef ehlssequenz im lokalen Speicher 
vorhanden ist. 

4. Verfahren nach Anspruch 1 bis 2, dadurch 
gekennzeichnet , daiS 

ein Befehl (REMOVE) innerhalb einer Bef ehlssequenz einen 
Vorgang auslost, durch den Befehlssequenzen einer Cache- 
Einheit geloscht werden. 

5. Verfahren nach Anspruch 1 bis 4, dadurch 
gekennzeichnet , dal5 

ein Befehl (EXECUTE) innerhalb einer Befehlssequenz das 
Laden einer bestimmten kompletten Befehlssequenz 
auslost . 

6. Verfahren nach Anspruch 1 bis 5, dadurch 
gekennzeichnet , dafi 

ein beliebiger Befehl (EXECUTE, REMOVE, etc) uber eine 
Busverbindung zwischen den Cache-Einheiten eine dem 
Befehl entsprechende Aktion auf einer bliebigen 
adressierten Cache-Einheit auslost . 

7. Verfahren nach Anspruch 1 bis 6, dadurch 
gekennzeichnet, dafi 

eine Programmsequenz, die nicht effektive cachebar ist, 
da diese nur von einer Cache-Einheit verwendet wird, in 
kleine Teilsequenzen zerlegt wird, die von mehreren 
Cache-Einheiten benotigt werden, eine weitere 
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Teilsequenz (IKR) enthSlt den nicht cachebaren Rest der 
Befehlssequenz und die Aufrufe der cachebaren 
Teilsequenzen. 

8. Verfahren nach Anspruch 1 bis 7, dadurch 
gekennzeichnet, da6 

jeder Befehlssequenz eine Statistik zugeordnet ist, die 
informationen aber das Alter, d.h. der Verweildauer im 
Speicher der Cache-Einheit, der Befehlssequenz gibt. 

9. Verfahren nach Anspruch 1 bis 7, dadurch 
gekennzeichnet, daB 

jeder Befehlssequenz eine Statistik zugeordnet ist, die 
Informationen uber die Haufigkeit der Aufrufe der 
Befehlssequenz gibt. 

10. Verfahren nach Anspruch 1 bis 7, dadurch 
gekennzeichnet, dafl 

jeder Befehlssequenz eine Statistik zugeordnet ist, die 
Informationen iiber die LSnge der Befehlssequenz gibt. 

t1. Verfahren nach Anspruch 1 bislO, dadurch 
gekennzeichnet, dafl 

die Loschroutine so ausgelegt ist, dafl sle die Statistik 
Deder Befehlssequenz auswertet und die entsprechend des 
ausgefUhrten Algorithmuses unwichtigste Befehlssequenz 
entfernt. 

12. Verfahren nach Anspruch 1 bis 11, dadurch 
gekennzeichnet, dafl 

die Laschroutine an den auszufQhrenden Algorithmus 
programmierbar anpassbar ist. 
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